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Préface à l'édition française 


À la fin des années 40 un nouveau cours, nommé « Analyse IIT », 
a été inclus dans les programmes de la Faculté des mathémati- 
ques de l’Université d'Etat de Moscou. Il comportait des élé- 
ments de la théorie de la mesure et de la théorie des fonctions, les 
équations intégrales, la théorie des espaces de Banach et cer- 
taines autres questions. Ce cours que nous avons professé pendant 
plusieurs années se trouve à l’origine du présent ouvrage. Par la 
suite, le cours d’« Analyse III », apparu premièrement à l’Université 
de Moscou, a été inclus dans les programmes d’autres universités. 

Tout en nous efforçant de donner dans cet ouvrage un exposé 
unique des questions générales de la théorie des ensembles, de la 
théorie de la mesure et de l’intégration, ainsi que des idées et des 
méthodes générales de l’analyse fonctionnelle, nous avons eu le 
souci d'accorder assez d’attention aux problèmes moins abstraits 
de l’analyse classique et même des mathématiques appliquées, 
où les questions citées plus haut trouvent leur application. Dans 
ses grandes lignes, le présent ouvrage correspond au programme du 
cours d’« Analyse III », adopté actuellement dans les universités 
soviétiques. 

À côté d’autres questions, nous avons réservé une place impor- 
tante à la théorie générale de la mesure. À cette occasion il faut 
signaler l’apparition récente d’un grand nombre d'ouvrages traitant 
de la théorie de l’intégration à partir du schéma de Daniel sans 
faire appel à la théorie de la mesure. A notre point de vue, la théorie 
de la mesure qui est largement utilisée dans la théorie ergodique, 
dans la théorie des processus aléatoires, etc., présente assez d’inté- 
rêt en elle-même, indépendamment du problème de l'introduction 
de la notion d’intégrale, pour être incluse dans un cours universi- 
taire obligatoire. 
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Pour la compréhension du contenu de ce livre le lecteur doit 
connaître l'analyse mathématique élémentaire et les fondements 
de l'algèbre linéaire. 

Lors de la traduction du livre en français le texte a été minu- 
tieusement revisé, les fautes d'impression et les défauts d’exposé 
remarqués ont été corrigés. 

Une aide importante dans ce travail nous a été fournie par le 
rédacteur de l'édition française V. A. Medvedev que nous tenons 
à remercier. 


Décembre 1973 
A. KOLMOGOROV 


S. FOMINE 


CHAPITRE PREMIER 


Eléments de la théorie 
des ensembles 


$ 1. Notion d’ensemble. 
Opérations sur les ensembles 


1. Généralités. En mathématiques on rencontre des ensembles 
de nature très variée. Citons, par exemple, l’ensemble des faces 
d’un polyèdre, l’ensemble des points d’une droite, l’ensemble des 
entiers naturels, etc. La notion d'ensemble est tellement générale 
qu'il est difficile de lui donner une définition qui ne se ramènerait 
pas au remplacement du mot « ensemble » par un de ses synonymes: 
totalité, groupement, collection d'éléments, etc. 

Le rôle que la notion d'ensemble joue dans les mathématiques 
modernes est déterminé non seulement par le fait que la théorie 
des ensembles est actuellement elle-même une discipline fort déve- 
loppée, mais surtout par l'influence que cette théorie, née à la fin 
du siècle passé, a exercé et continue à exercer sur toute la science 
mathématique. Nous n'avons pas l'intention de donner ici un 
exposé plus ou moins complet de la théorie des ensembles. Nous 
introduirons seulement les notations principales et définirons les 
notions les plus élémentaires, nécessaires pour la suite. 

Les ensembles seront désignés par des lettres majuscules 
À, B,... et leurs éléments par des lettres minuscules a, b, ... 
L’assertion « l'élément a appartient à l’ensemble À » s'écrit symbo- 
liquement : a € À ou À 3 a; l'écriture a À (ou À 3 a) signifie que 
l'élément a n'appartient pas à À. Si tous les éléments de l’ensemble 
À appartiennent également à l’ensemble B (le cas À — B n'étant 
pas exclu), on dit que À est un sous-ensemble ou une partie de l’en- 
semble B et on écrit AG B. Par exemple, les nombres entiers consti- 
tuent un sous-ensemble de l’ensemble des nombres réels. 

Parfois on ne sait pas d'avance si tel ou tel ensemble (par exem- 
ple, l’ensemble des racines d’une équation) contient ou non au moins 
un élément. C’est pourquoi il est utile d'envisager des ensembles 
ne contenant aucun élément ; un tel ensemble est appelé ensemble 
vide et noté par le symbole @. Tout ensemble contient @ comme 
sous-ensemble. 

2. Opérations sur les ensembles. Soient À et B deux ensembles 
arbitraires ; on appelle réunion ou somme de À et B l'ensemble 
€ = À |) B des éléments qui appartiennent au moins à l’un des 
ensembles À et B (fig. 1). 
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On définit de manière analogue la réunion d’un nombre arbi- 
traire (fini ou infini) d’ensembles: si À, sont les ensembles 
donnés, leur réunion U 4, est l’ensemble des éléments dont chacun 


[6 4 
appartient au moins à l’un des ensembles À, 
On appelle intersection de deux ensembles À et B l’ensemble 
C — À f\ B des éléments qui appartiennent à la fois à À et à B 
(fig. 2). Par exemple, l'intersection de l’ensemble des entiers pairs 


À B 


C=4N8 
Fig. 1 Fig. 2 


et de l’ensemble des entiers divisibles par 3 est l’ensemble des entiers 

divisibles par 6. L'’intersection d’un nombre arbitraire 

(fini ou infini) d’ensembles À, est par définition l’ensemble (4, 
(#2 


des éléments appartenant à la fois à tous les ensembles 4,. 
Par leur définition même, la réunion et l'intersection des ensem- 
bles sont des opérations commutatives et associatives, c’est-à-dire 


AUB = BUA, (AUB)UC = AU (BUC), 
ANB = BNA, (AnB) NC = AN (BNC). 


En outre, chacune d'elles est distributive par rapport à l’autre: 


(AUB) NC = (ANC) U (BNC), (1) 
(ANB) UC = (AUC) N (BUCY). (2) 
En effet, démontrons, par exemple, la première de ces égalités ?). 
Soit x un élément de l’ensemble qui se trouve au premier membre 
de l’égalité (1), c’est-à-dire x € (Al) B) NC. Cela signifie que x appar- 
tient à Cet à l’un au moins des ensembles À et B. Mais alors x appar- 
tient au moins à l’un des ensembles ANC et BNC, c’est-à-dire il 
appartient au second membre de l'égalité (1). Réciproquement, 
soit x E (ANC) U (BNC). On a alors x E ANC ou x E BNC. Par 
conséquent, x appartient à C et à l’un au moins des ensembles 
AetB, c'est-à-dire x € CetxE AUB, ce qui fait que x E (ALJB) NC. 
L'égalité (1) est démontrée. La démonstration de l'égalité (2) est 
analogue. 
1) L'égalité de deux ensembles À — B signifie que tout élément de À appar- 


tient à B, et vice versa. Autrement dit, l'égalité À = B est équivalente aux 
deux inclusions simultanées À € B et BC A. 
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Définissons maintenant la soustraction des ensembles. On appelle 
différence de deux ensembles À et B l'ensemble C — À  B des 
éléments de À n’appartenant pas à B (fig. 3). En général, il n’est 
pas obligatoire que AZB. Au lieu de A X B on écrit parfois À — B. 

Il est parfois commode (par exemple, dans la théorie de la mesure) 
de se servir de la différence symétrique de deux ensemb'es À et B qui 
est, par définition, la réunion des différences AXB et B\AÀ (fig. 4). 


A Pr] 
C=4\8 C=AAB 
Fig. 3 Fig. 4 


On désigne la différence symétrique des ensembles À et B par À A B. 
Ainsi donc, par définition, 


AAB=(ANXB)U (BXA). 
Exercice. Montrer que 


AAB=(AUB)(A/NB). 


On est amené souvent à considérer des ensembles qui sont tous 
des parties d’un même ensemble S (référentiel). C'est le cas, par 
exemple, des ensembles dont les éléments sont des points de la 
droite numérique. Dans ce cas, la différence S X À s’appelle complé- 
mentaire de l’ensemble À et se note CA ou À”. 

Dans la théorie des ensembles et ses applications on recourt 
souvent à un principe très important, nommé principe de 
dualité et fondé sur les deux relations suivantes: 

1. Le complémentaire de la réunion est égal à l'intersection des 
complémentaires : 


SN U 4a= 1 (SN Aa) (3) 


2. Le complémentaire de l'intersection est égal à la réunion des 
complémentaires : 


SN M Aa UE NX Aa). (4) 


Le principe de dualité consiste en ceci: de toute égalité portant 
sur des parties de l’ensemble de référence S on peut obtenir tout 
à fait automatiquement une autre égalité, dite duale 
de la première, en remplaçant tous les ensembles considérés par 
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leurs complémentaires, les réunions par des intersections et les 
intersections par des réunions. Un exemple d'application de ce 
principe est fourni au $ 2, chap. II, par la déduction du théorème 3° 
à partir du théorème 3. 
Démontrons la relation (3). 
Soit x ESXUA,. Cela signifie que x n'appartient pas à la 
œ 


réunion [J ÀA, et donc n'appartient à aucun des ensembles 4,. Par 
œ 


<onséquent, x appartient à tous les complémentaires S A, et donc 
x EN (SK 4,4). Réciproquement, supposons que x € f (SX 44), 
œ 


« 


œ 
c'est-à-dire que x appartienne à chacun des ensembles $S X 4, ; 
alors x n’appartient à aucun des ensembles À,, c’est-à-dire n’appar- 
tient pas à leur réunion (JA, et donc x ES (A, L'égalité (3) est 

œ 


œ 
démontrée. La relation (4) se démontre de façon.analogue. (Faites 
cette démonstration.) 


Le terme « différence symétrique », introduit pour désigner l'opération 
À AB, n’est pas tout à fait réussi; cette opération est, sous beaucoup de rap- 
ports, analogue à la réunion de deux ensembles À |] B. En effet, l'expression 
À | B signifie que les deux assertions: «l’élément appartient à À » et « l’élé- 
ment appartient à B » sont liées par le «ou » inclusif, tandis que l'expression 
A AB signifie que les mêmes deux assertions sont liées par le «ou » exclusif: 
l'élément x appartient à À A B si et seulement s’il appartient ou seulement 
à À, ou seulement à B. L'ensemble À A B pourrait être appelé « réunion modulo 
-deux » de À et B (on prend la réunion de ces deux ensembles, mais on rejctte les 
‘éléments que l’on rencontre deux fois). 


$ 2. Applications. Partition d’un ensemble 


1. Application d’un ensemble dans un autre. Notion générale de 
fonction. En analyse on définit la notion de fonction de la manière 
suivante. Soit À un sous-ensemble quelconque de la droite numéri- 
que. On dit qu’on a défini sur cet ensemble une fonction 
f, si à tout nombre x € X on a fait correspondre un nombre bien 
déterminé y = f (x). L'ensemble X est appelé domaine de définition 
de la fonction j ; l’ensemble Y de toutes les valeurs prises par cette 
fonction s’appelle domaine de valeurs de f. 

Si au lieu des ensembles numériques on considère des ensembles 
de nature arbitraire, on est conduit à la notion la plus générale 
de fonction. Soient A1 et N deux ensembles quelconques. On dit 
qu'on a défini sur A7 une fonction f à valeurs dans À, si à tout élé- 
ment x de M on a fait correspondre un élément y de V et un seul. 
Dans le cas des ensembles de nature arbitraire (y compris les ensem- 
bles numériques) au lieu du mot « fonction » on utilise souvent le 
mot « application » ei on parle alors de l’application d’un ensemble 
dans un autre. En spécialisant la nature des ensembles M et N, 
«on obtient divers types de fonctions qui portent des noms spéciaux, 
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comme «fonction vectorielle », «mesure », « fonctionnelle », « opé- 
rateur », etc. [Il en sera question dans la suite. 

Pour désigner une fonction (une application) de M dans N nous 
utiliserons souvent l'écriture f: M — N. 

Si a est un élément de M, on dit que l'élément b — f (a) qui 
lui correspond dans ŸV est son image par (ou dans) l’application f. 
L'ensemble de tous les éléments a de M ayant pour image l'élément 
donné b de N s’appelle image réciproque de b et se note f”! (b). 

Soit À une partie de M; l’ensemble {f (a):a € A} de tous les 
éléments f (a) tels que a € À s’appelle image de À et se note f (4). 
Pour chaque partie B de N on définit à son tour l’image réciproque 
f"! (B): c’est l’ensemble de tous les éléments de M dont l’image 
appartient à B. Il peut arriver que dans M il n'existe aucun élément 
dont l’image par f soit un élément de B; dans ce cas l’ensemble 
f"1(B) est vide. 

Nous nous bornerons ici à l’étude des propriétés les plus géné- 
rales des applications. 

Nous adoptons la terminologie suivante. On dit que f est une 
application de l’ensemble M « sur » l’ensemble N, si f (M) = N: 
une telle application s'appelle encore surjection. Dans le cas général, 
c'est-à-dire lorsque f (M)CN, on dit que f est une application 
de M «dans» AN. 

Si pour n'importe quels deux éléments distincts x, et x: de M 
leurs images y, = (x) et y: = (x2) sont aussi distinctes, l’applica- 
tion f est appelée injection. 

On se propose d’établir les propriétés fondamentales des appli- 
cations. 


Théorème 1. L'image réciproque de la réunion de deux 
ensembles est égale à la réunion de leurs images réciproques : 


f7" (AUB) = f7 (4) UfT (B). 


émonstration. Soit x un élément de l’ensemble 

"1 (4[JB). Cela signifie que f (x) € AlJB, c’est-à-dire que f (x) € À 

€ B. Mais alors x appartient au moins à l’un des ensembles 

"1 (4) et f-1(B), c'est-à-dire x € f-! (A)|Jf-1 (B). Réciproquement, 

si x appartient à f ! (A)Uf-! (B), il appartient alors au moins à l’un 

des ensembles f-! (4) et f-! (B); cela signifie que f (x) appartient 

au moins à l’un des ensembles À et B et donc f (x) € AlJB, d’où 
il résulte que x Ef ! (AU B). 


Théorème 2. L'image réciproque de l'intersection de deux 


ensembles est égale à l'intersection de leurs images réciproques : 


jf QANB) = f7 (4) NT (B). 
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Démonstration. Si xE€f!(AfNB), on a f(x) E ANB, 
c'est-à-dire 


f (x) EA et f(x) EB, 


mais alors x € f  (4)et x € f-! (B), c’est-à-dire x € f ! (A) Nf"! (B). 
Réciproquement, si x €f !(4)ff!(B), on a æxE€f !(4) et 
x Ef !(B). Par conséquent, f(x) € À et f(x) E B, c'est-à-dire 
f (x) E ANB, d’où l’on déduit que x € f-! (ANB). 
Les théorèmes 1 et 2 restent valables pour la réunion et l’inter- 
section d’un nombre arbitraire (fini ou infini) d’ensembles. Il en 
est de même du théorème suivant. 


Théorème 3. L'image de la réunion de deux ensembles est 
égale à la réunion de leurs images: 


f AUB) = f (A)Uf (B). 


Démonstration. Si yEf(AlJB), cela signifie que 
y = f (x), où x est un élément qui appartient au moins à l’un des 
ensembles À et B. Par conséquent, y = f (x) € f (A) | f (B). Récipro- 
quement, si y € f (A)Uf (B), on a y = f(x), où x appartient au 
moins à l’un des ensembles À et B, c’est-à-dire x € AlJB et donc 
y = f (x) € (AUB). 

Remarquons que l’image de l'intersection de deux ensembles ne 
coincide pas, en général, avec l'intersection de leurs images. Par exem- 
ple, si l’application considérée est la projection du plan sur l’axe 
x, les segments 


OLrz A1, y = 0, 
OS zx LA, y = 1. 
n'ont aucun point commun, tandis que leurs images coïncident, 


E xercice. Démontrer que l’image réciproque du complémentaire d’un 
ensemble est égale au complémentaire de son image réciproque. La proposition 
analogue est-elle aussi vraie pour l’image du complémentaire? 


2. Partition d’un ensemble. Relation d’équivalence. Dans les 
questions les plus diverses on a affaire au partage de tel ou tel ensem- 
ble en parties deux à deux disjointes. Par exemple, le plan (consi- 
déré comme ensemble de points) peut être décomposé en droites 
parallèles à l’axe x, l’espace à trois dimensions peut être considéré 
comme la réunion des sphères concentriques de différents rayons 
r (y compris r — 0), les habitants d’une ville peuvent être partagés 
en groupes suivant l’année de naissance de chacun, etc. 

Chaque fois qu'un ensemble M est représenté d’une manière 
quelconque sous forme d’une réunion de sous-ensembles deux à deux 
disjoints de M, nous dirons que l’ensemble M est partagé en classes 
ou qu’on a une partition de l'ensemble M (en classes). 
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D'habitude, on a affaire à des partitions qui sont obtenues 
à l’aide d’un critère, suivant lequel les éléments de l’ensemble 
M sont partagés en classes. Par exemple, l’ensemble des triangles 
du plan peut être partagé en classes de triangles égaux ou en classes 
de triangles de même aire, l’ensemble des fonctions d’une variable 
x peut être partagé en classes, en réunissant dans une même classe 
les fonctions qui prennent la même valeur en un point donné, etc. 

Les critères, suivant lesquels on partage les éléments d’un ensem- 
ble en classes, peuvent être de nature très variée. Tout de même 
ils ne sont pas entièrement arbitraires. Supposons, par exemple, 
que l’on veuille partager l’ensemble des nombres réels en classes, 
de façon qu’un nombre b soit rapporté à la même classe que le nombre 
a si, et seulement si, b > a. Il est clair qu’une telle partition de 
l’ensemble des réels est impossible, car si b => à, b doit être mis dans 
la même classe que a, maïs d’autre part, étant donné que a € b, 
a ne peut pas se trouver dans la même classe que b. De plus, comme 
a n’est pas plus grand que a, il ne peut pas se trouver dans la même 
classe que lui-même! Un autre exemple. Essayons de définir une 
partition de l'ensemble des points du plan, de façon que deux 
points a et b appartiennent à une même classe si, et seulement si, 
la distance de a à b est inférieure à 1. Il est clair que cela est impos- 
sible, car si la distance de a à b est inférieure à 1 et la distance de 
b à c est inférieure à 1, cela n'implique nullement que la distance 
de a à c est aussi inférieure à 1. Donc, si l’on met a dans la même 
classe que b et b dans la même classe que c, il peut arriver que deux 
points, dont la distance est supérieure à 1, se trouvent dans la même 
classe. | 

Les exemples cités ci-dessus nous indiquent les conditions qui 
doivent être satisfaites pour que tel ou tel critère permette effecti- 
vement de partager les éléments d’un ensemble en classes. 

Soit M un ensemble. Supposons que certains couples d'éléments 
(a, b) de cet ensemble soient « marqués » !). Si (a, b) est un couple 
« marqué », nous dirons que l'élément a est lié à l'élément b par la 
relation @ et écrirons: a — b. Par exemple, s’il s’agit de la parti- 

p 
tion de l’ensemble des triangles du plan en classes de triangles de 
même aire, l'écriture a — b signifie : « le triangle a a la même aire 
? 

que le triangle d ». On dit que la relation q est une relation d'équiva- 
lence, lorsqu'elle possède les propriétés suivantes : 

1. Réflexivité: a — b, quel que soit l'élément a € M. 


p 
2. Symétrie: si a — b, alors b = 4. 
ie eus . ® P 
3. Transitivité: si a — b et b — c, alors a = c. 
3 p p 


*) Les éléments a et b sont pris dans l’ordre, c’est-à-dire (a, b) et (b, a) 
sont considérés, en général, comme deux couples différents. 
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Ces conditions sont nécessaires et suffisantes pour .que la rela- 
tion œ (le critère!) permette de partager l’ensemble / en classes. 
En effet, toute partition de l’ensemble M définit une relation 
d'équivalence entre ses éléments. En effet, si a — b signifie: «a 


« 


w 
appartient à la même classe que b », la relation œ est réflexive, 
symétrique et transitive, ce qui est facile à vérifier. 
Réciproquement, soit ® une relation d'équivalence définie dans 
M et soit X, la classe des éléments x € M équivalents à l'élément 
donné a: x = a. En vertu de la réflexivité, l'élément «a appartient 


w 
lui-même à la classe X,. Montrons que deux classes XÀ, et K, sont 
soit confondues, soit disjointes. En effet, soit c un élément apparte- 
nant à la fois à Æ, et à K},, c’est-à-dire tel que c — a et c — b. 
® ® 
Alors, par symétrie a — c et par transitivité 
® 


a — b. (1) 


à 


Si maintenant x est un élément quelconque de XK,, c’est-à-dire 
si æ — a, en vertu de (1) et de la transitivité on à x — b, ce qui 
P 


P 
signifie que x € K3. 

On démontre de la même façon que tout élément y de À, appar- 
tient à À,. Donc, si deux classes À, et Æ, ont au moins un élément 
commun, elles sont confondues. On obtient ainsi une partition 
de l’ensemble { en classes, définie par la relation d'équivalence 
donnée. 

La notion de partition d’un ensemble en classes est en rapport 
direct avec la notion d'application, introduite au numéro précédent. 

Soit f une application d’un ensemble À dans un ensemble B. 
Lorsqu'on réunit dans la même classe tous les éléments de À qui 
ont la même image dans B, on obtient évidemment une partition 
de l’ensemble À. Réciproquement, considérons un ensemble quel- 
conque À et une partition de cet ensemble en classes. Soit B l’ensem- 
ble de ces classes. En faisant correspondre à tout élément a € À 
la classe (c’est-à-dire l’élément de B) à laquelle il appartient, on 
obtient une application de l’ensemble À sur l’ensemble B. 

Exemples 1. Projetons le plan xy sur l'axe x. Les images 
réciproques des points de l’axe x sont alors des droites verticales. 
Par conséquent, à l’application considérée correspond une partition 
du plan en droites parallèles. 

2. Partageons les points de l’espace à trois dimensions en clas- 
ses, en rapportant à la même classe les points équidistants de 
l'origine. Chaque classe est alors une sphère d’un certain rayon. 
L'ensemble de toutes. ces classes peut être identifié à l’ensemble 
des points situés sur le demi-axe[0, œ).Donc,.la partition-de l’espace 
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à trois dimensions en sphères concentriques définit une application. 
de cet espace sur une demi-droite. 

3. Rapportons à une même classe tous les nombres réels ayant. 
la même partie décimale. La partition que l’on obtient définit. 
une application de la droite sur une circonférence de lon- 
gueur 1. 

La relation d'équivalence est un cas particulier de la notion 
plus générale de relation binaire. Soit M un ensemble 
quelconque. Notons par M X M ou M° l’ensemble de tous les 
couples ordonnés (a, b) avec a, b € M. On dit que dans M on a défi- 
ni une relation binaire @, si on a choisi dans M? un sous-ensemble 
arbitraire R,. Plus précisément, nous dirons que l'élément a est 
lié à l’élément b par la relation binaire œ et écrirons ab si et seule- 
ment si le couple (a, b) appartient à R,. Comme exemple de relation 
binaire on peut considérer la relation d'identité €, définie de la 
manière suivante : on a aæeb si et seulement si a — b; autrement dit, 
c'est la relation binaire définie par la diagonale À de MX M, 
c'est-à-dire par l’ensemble des couples de la forme (a, a). Il est 
clair que toute relation d'équivalence ®, définie dans un ensemble 
M, est une relation binaire qui vérifie les conditions suivantes: 

1) La diagonale À de M* appartient à R, (réflexivité). 

2) Si (a, b) ER,, alors (b, a) ER, (symétrie). 

3) Si (a, b)ER, et (b, c)E R,, alors (a, c) E R, (transitivité). 

Ainsi donc, la relation d'équivalence est une relation binaire 
réflexive, symétrique et transitive. 

Nous verrons au $ 4 un autre cas particulier important de la 
relation binaire: la relation d'ordre. 


$ 3. Ensembles équipotents. 
Puissance d’un ensemble 


1. Ensembles finis et infinis. En considérant toute sorte d’ensem- 
bles, on remarquera qu'il est parfois possible de déterminer, sinon 
pratiquement, du moins en principe, le nombre d'éléments de l’en- 
semble donné. C’est le cas, par exemple, de l’ensemble des sommets 
d’un polyèdre, de l’ensemble des nombres premiers inférieurs à un 
nombre donné, de l’ensemble des molécules d’eau sur la Terre, etc. 
Chacun de ces ensembles contient un nombre fini d'éléments. bien 
que ce nombre puisse être inconnu. D'autre part, il existe des ensem- 
bles dont le nombre d'éléments est infini. Comme exemples on 
peut citer l’ensemble des entiers naturels, l’ensemble des points 
d’une droite, l’ensemble des cercles du plan, l’ensemble des poly- 
nômes à coefficients rationnels, etc. Lorsqu'on dit qu’un ensemble 
est infini, cela signifie qu’on peut extraire de cet ensemble un élé- 
ment, puis unñ autre, etc. et qu'après chaque extraction il reste 
encore des éléments dans cet ensemble. 
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Si deux ensembles sont finis, on peut les comparer et voir s’ils 
ont le même nombre d'éléments ou si l’un contient plus d'éléments 
que l’autre. La question suivante se pose: une Comparaison pareille 
est-elle possible pour des ensembles infinis? Autrement dit, est-il 
sensé de demander, par exemple, s’il y a plus de cercles sur le plan 
que de points rationnels sur la droite numérique, ou s’il y a autant 
de fonctions définies sur le segment [0, 1] que de droites dans 
l’espace, etc.? 

Voyons, comment on s’y prend pour comparer deux ensembles 
finis. On peut, par exemple, compter les éléments de chacun et 
comparer ensuite les nombres obtenus. Mais on peut procéder autre- 
ment : essayer d'établir une bijection, c'est-à-dire une correspondance 
biunivoque, entre les éléments de ces ensembles, autrement dit, 
une correspondance telle qu’à chaque élément d’un ensemble cor- 
responde un élément et un seul de l’autre ensemble, et vice versa. 
Il est clair qu’on peut établir une correspondance biunivoque entre 
les éléments de deux ensembles finis si et seulement si les deux 
ensembles contiennent le même nombre d'éléments. Par exemple, 
pour vérifier si le nombre d'étudiants d’un groupe est le même 
que le nombre de chaises d’une salle de conférences, au lieu de comp- 
ter les uns et les autres, on peut faire asseoir chaque étudiant sur 
une chaise. S'il se trouve que tous les étudiants sont assis et aucune 
chaise ne reste inoccupée, c’est-à-dire si on a établi une bijection 
entre ces deux ensembles, c’est qu’ils ont le même nombre d'’élé- 
ments. 

Notons maintenant que si le premier procédé (le comptage des 
éléments) n’est valable que pour les ensembles finis, le second 
(l'établissement d’une correspondance biunivoque) est valable pour 
les ensembles finis aussi bien que pour les ensembles infinis. 

2. Ensembles dénombrables. Le plus simple de tous les ensembles 
infinis est l’ensemble des entiers naturels. On appelle ensemble 
dénombrable tout ensemble dont les éléments peuvent être mis en 
correspondance biunivoque avec les entiers naturels. En d’autres 
termes, un ensemble dénombrable est un ensemble dont les éléments 
peuvent être numérotés et disposés sous forme d'une suite infinie: 
dj, Ao, . . ., An, . . . Considérons quelques exemples d'ensembles 
dénombrables. 

1. L'ensemble des entiers relatifs. On établit une bijection entre 
l'ensemble des entiers relatifs et l’ensemble des entiers naturels 
selon le schéma suivant: 


0 —1 1 —2 2 ..., 
1 2 3 4 9 


c'est-à-dire à tout entier positif ou nul nr > 0 on fait correspondre 
le naturel impair 2n + 1 et à tout entier négatif nr 0 on fait 
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correspondre le naturel pair 2|n|: 


ne 2n +1 pour n >0, 
n—2|n| pour n<0. 


2. L'ensemble des entiers positifs pairs. La bijection est évidente 
n «+ on. 

3. L'ensemble 2, 4, 8, ..., 2°, ... des puissances du nombre 
2. La bijection entre cet ensemble et l’ensemble des entiers naturels 
est également évidente: 27<-+ 2. 

4. Considérons en exemple plus compliqué: montrons que l’en- 
semble des nombres rationnels est dénombrable. Tout nombre ration- 
nel peut être représenté de façon unique sous forme d’une fraction 


irréductible à« = F avec qg > 0. Nous appellerons hauteur du nombre 
rationnel &« la somme |p | + q. Il est clair que les fractions de 
hauteur donnée n sont en nombre fini. Par exemple, la hauteur 1 ne 


peut être atteinte que par le nombre + , la hauteur 2 par les nombres 


1 2 { 
Z et —+, la hauteur 3 par les nombres 1 et 


2 
T3 T7 — 7 » Etc. 
Numérotons les nombres rationnels dans l’ordre de croissance de la 
hauteur, c’est-à-dire d’abord les nombres de hauteur 1, puis les 
nombres de hauteur 2, et ainsi de suite. Comme tout nombre ration- 
nel se trouve alors muni d’un numéro, on obtient une correspondance 
biunivoque entre l’ensemble des nombres rationnels et l’ensemble 
des entiers naturels. 

On établit ici quelques propriétés générales des ensembles 
c'énombrables. 

1. Tout sous-ensemble d'un ensemble dénombrable est fini ou 
dénombrable. 


Démonstration. Soient À un ensemble dénombrable 
et B un sous-ensemble de À. Numérotons les éléments de À : a, 
Ag, + + +, Any + + + SOÏENT Ans Ans - - - CeUX des éléments ci-dessus 
qui appartiennent à B. Si parmi les nombres n,, n+, . . . il existe 
un plus grand, l’ensemble B est fini, sinon il est dénombrable, puis- 
que ses éléments sont numérotés à l’aide des nombres 1, 2, ... 

2. Toute réunion finie ou dénombrable d'ensembles dénombrables 
est un ensemble dénombrable. 


Démonstration. Soient À4,, A», ... des ensembles 
dénombrables. On peut toujours considérer ces ensembles comme 
étant deux à deux disjoints, car s’il n’en était pas ainsi, on pourrait 
considérer à leur place les ensembles 4,, A,  A,, AëX(AiU 4), ... 
dont chacun est fini ou dénombrable et dont la réunion est la même 
que celle de À,, 42, . .. Les éléments des ensembles À,, Ao, . .. 


2—0167 
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deuvent être disposés sous la forme du tableau infini suivant: 
Agir My2d13@1a +. . 
lol 22A 2302 + .. 
As 32033034 + -. 
dyda2dasdag + +. 
où la première ligne représente la suite des éléments de À4,, la deu- 
xième ligne, la suite des éléments de 4, etc. Numérotons maintenant 
tous ces éléments « en diagonale », c’est-à-dire de façon que 41 


soit le premier élément, a;2 le deuxième, a», le troisième, et ainsi 
de suite, dans l’ordre indiqué par les flèches du tableau ci-après: 


OT 
dy 22 3 y 
7 
Us ss ss x 
PA 


Ai dy2 A3 (TA .. 


Il est clair que de cette façon chaque élément de chacun des ensem- 
bles considérés sera muni d’un numéro bien déterminé: on aura 
donc une correspondance biunivoque entre l’ensemble de tous les 
éléments de À,, A», ... et l’ensemble des entiers naturels, ce 
qu’il fallait démontrer. 


Exercices. 1. Démontrer que l’ensemble des polynômes à coefficients 
rationnels est dénombrable. 

2. Un nombre Ë est dit algébrique, s’il est racine d’un polynôme à coefficients 
rationnels. Démontrer que l’ensemble des nombres algébriques est dénombrable. 

3. Démontrer que l’ensemble des intervalles rationnels (c’est-à-dire des 
intervalles à extrémités rationnelles) de la droite numérique est dénombrable. 

4. Démontrer que l’ensemble de tous les points du plan ayant des coordon- 
nées rationnelles est dénombrable. 

Indication. Appliquer la propriété 2. 


3. Tout ensemble infini contient un sous-ensemble dénombrable. 


Démonstration. Soit M un ensemble infini. Choisissons 
dans M un élément quelconque a,;. Comme M est infini, on peut 
trouver dans M un élément «>, différent de a,, puis un élément az 
différent de a; et a>, etc. En continuant indéfiniment ce processus 
(qui ne peut pas s'arrêter par « insuffisance » d'éléments, M étant 
un ensemble infini), on obtient un sous-ensemble dénombrable 


À = {ay, A2, . .., An, +. .} 


de l’ensemble A7, ce qu'il fallait démontrer. 
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Cette proposition montre que les ensembles dénombrables sont 
«les plus petits » des ensembles infinis. Nous verrons plus bas 
qu'il existe des ensembles infinis non dénombrables. 

3. Ensembles équipotents. En comparant différents ensembles 
infinis avec la suite des nombres naturels, on a été conduit à la 
notion d'ensemble dénombrable. Mais un ensemble donné peut 
être comparé non seulement avec l’ensemble des entiers naturels : 
l'établissement d’une correspondance biunivoque (d’une bijection) 
permet de comparer n'importe quels deux ensembles. Introduisons 
la définition suivante. 

Définition. Deux ensembles M et N sont dits équipotents 
(notation : M — N), s’il est possible d’établir une correspondance 
biunivoque entre leurs éléments. 

La notion d’équipotence est applicable aussi bien aux ensembles 
finis, qu'aux ensembles infinis. Deux ensembles finis sont équipo- 
tenits, si (et seulement si) ils ont le même nombre d'éléments. La 


Fig. 5 Fig. 6 


définition d'un ensemble dénombrable peut être formulée mainte- 
nant de la manière suivante: un ensemble est appelé dénombrable, 
s'il est équipotent à l'ensemble des entiers naturels. 

Il est clair que deux ensembles équipotents à un troisième sont 
équipotents entre eux ; en particulier, n'importe quels deux ensem- 
bles dénombrables sont équipotents entre eux. 

Exemples. 1. Deux segments arbitraires [a, b] et [c, dl, 
considérés comme ensembles de points, sont équipotents. Sur la 
figure 5 il est indiqué, comment établir une bijection entre ces 
deux ensembles: deux points p et g correspondent l’un à l’autre, 
s’ils sont situés sur la même droite passant par le point ©, inter- 
section des droites ac et bd. 

2. L'ensemble des points du plan complexe achevé est équipo- 
tent à l’ensemble des points d’une sphère. La bijection &« <> z peut 
être établie à l’aide de la projection stéréographique (fig. 6). 

3. L'ensemble des nombres réels de l'intervalle (0,1) est équipo- 
tent à l’ensemble des points d’une droite. Une correspondance 
biunivoque peut être établie, par exemple, à l’aide de la fonction 


Â 1 
y — TX arcig L + . 
+ 


20 ÉLÉMENTS DE LA THÉORIE DES ENSEMBLES [Ch. 1 


En examinant les exemples ci-dessus et ceux du n°2, on remar- 
quera qu'un ensemble infini peut être équipotent à certaines de ses 
parties. Par exemple, il a y «autant » de nombres naturels que 
des nombres entiers et même « autant » que des nombres ration- 
nels ; dans l'intervalle (0,1) il y a « autant » de points que sur toute 
la droite, etc. C’est une propriété caractéristique des ensembles 
infinis. En effet, au n°2 (propriété 3) on a montré que de tout ensem- 
ble infini M on peut extraire un sous-ensemble dénombrable; soit 
À = {dj, A, . . ., An, . . .} un tel sous-ensemble. 

Partageons À en deux sous-ensembles dénombrables : 


A1 = {d, A3, A5, . . .} et A2 — {as du, 6, + . .} 


et établissons une correspondance biunivoque entre À et À,. Cette 
correspondance peut être ensuite prolongée jusqu'à une bijection 
entre les ensembles À || (MN A) = M et A,U(MNXA) = MN 4», 
en faisant correspondre à tout élément de MX À cet élément lui- 
même. Cependant l’ensemble MX 4, n’est pas confondu avec M, 
c'est-à-dire il est un sous-ensemble propre de M. On a démontré 
donc la proposition suivante: 

Tout ensemble infini possède au moins un sous-ensemble propre 
qui lui est équipotent. 

Cette propriété peut être adoptée comme définition d’un ensemble 
infini. 

Exercice. Démontrer que si M est un ensemble infini quelconque et À 
un ensemble dénombrable, on a M - M |JA. 

4. Non-dénombrabilité de l’ensemble des nombres réels. Au n° 2 
nous avons vu quelques exemples d’ensembles dénombrables. Le 
nombre de ces exemples pourrait être augmenté. D'autre part, 
comme nous l’avons déjà montré, la réunion d’un nombre fini ou 
d’une infinité dénombrable d’ensembles dénombrables est aussi 
un ensemble dénombrable. 

Il est donc naturel de se demander: existe-t-il effectivement 
des ensembles non dénombrables? Le théorème suivant répond 
affirmativement à cette question. 


Théorème 1. L'ensemble des nombres réels, compris entre 
O et À, est non dénombrable. 

Démonstration. Soit un ensemble dénombrable quel- 
conque de nombres réels &« appartenant au segment [0, 1]: 


(21 — 0, dy1di9 13 +. Ain + .., 
Œo —=0, 21 9903 +. Aon ..., 
X3 — 0, 31 39033 +... Ain ..., (1) 
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Ici a;, désigne le k-ième chiffre décimal du nombre &;. Construisons 
un nombre décimal 
B = 0, bibo . .. bn... 

par le procédé diagonal de Cantor, plus précisément, de façon que 
b, soit un chiffre arbitraire différent de a;,, b, un chiffre arbitraire 
différent de a2», etc. ; d’une façon générale, b, doit être un chiffre 
arbitraire différent de a,»,. Le nombre $ ainsi construit ne peut pas 
appartenir à la suite (1). En effet, il diffère de &«, au moins par le 
premier chiffre décimal, de &, par le deuxième chiffre décimal, etc. ; 
d’une façon générale, puisque b, =£ 4», pour tous les n, $ est dif- 
férent de tous les nombres «a; de la suite (1). Par suite, aucun 
ensemble dénombrable de nombres réels, appartenant au segment 
[0, 1], ne peut épuiser ce segment. 

Dans cette démonstration il y a une petite « erreur ». Le fait: 


est que certains nombres (à savoir, les nombres de la forme x) 


peuvent avoir deux développements décimaux différents: avec 
0 en période ou avec 9 en période; par exemple, 


1 =? = 0,5000 .… —0,4999 


Donc, si deux nombres sont représentés par des développe- 
ments décimaux distincts, cela ne prouve pas qu’ils sont inégaux. 
Tout de même, lorsqu'on construit le nombre 6 avec plus de pru- 
dence, en évitant les chiffres 0 et 9, par exemple, en posant b, = 2 
POUT Ann = 1 et b, = 1 pour a,, 1, la démonstration est correcte. 


Exercice. Montrer que les nombres possédant deux développements 
décimaux distincts forment un ensemble dénombrable. 


Ainsi donc, le egment [0, 1] nous fournit un exemple d'ensemble 
non dénombrable. Citons quelques exemples d’ensembles équipo- 
tents au segment [0, 1]. 

, 1. L'ensemble des points de tout segment [a, b] ou intervalle 
a, b). 

2. L'ensemble des points d’une droite. 

9. L'ensemble des points du plan, de l’espace, d’une sphère, 
de l’intérieur d’une sphère, etc. 

4. L'ensemble des droites du plan. 

9. L'ensemble des fonctions continues d’une seule ou de plu- 
sieurs variables. 

Dans les cas 1 et 2 la démonstration ne présente aucune dit- 
ficulté (cf. exemples 1 et 3, n° 3). Dans les autres cas une démonstra- 
tion directe serait assez compliquée. 

Exercice. En utilisant les résultats de ce numéro et l'exercice 2 du n°2, 


démontrer l’existence des nombres transcendants, c’est-à-dire des nombres qui 
ne sont pas algébriques. 
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9. Théorème de Cantor-Bernstein. Le théorème suivant est l’un 
des plus importants de la théorie des ensembles. 


Théorème 2 (de Cantor-Bernstein). Soient 
A et B deux ensembles quelconques. S'il existe une application biuni- 
vogue f de l’ensemble À sur un sous-ensemble B, de B et une applica- 
lion biunivoque g de l’ensemble B sur un sous-ensemble À, de À, les 
ensembles À et B sont équipotents. 


Démonstration. Soit x un élément quelconque de À. 
Posons x, — x, et définissons par récurrence une famille d'éléments 
de la manière suivante. Supposons que x, soit déjà défini. Lorsque 
n est pair on prend dans B l'élément x,., tel que xz, = f (th+1), 
et lorsque n est impair on prend dans À l'élément x,:, tel que 
Tn = £ (Xh+1), Si un tel élément existe. Deux cas sont possibles. 

1°. Pour un certain n il n'existe pas de x,,, répondant à la condi- 
tion posée. On appellera alors ordre de x ce nombre n. 

-29. La suite des x, est infinie. Dans ce cas, l'élément x sera dit 
d'ordre infini. 

Partageons maintenant À en trois parties: À formée des élé- 
ments d'ordre pair, À, formée des éléments d'ordre impair et À; 
des éléments d'ordre infini. 

Après une partition analogue de l’ensemble B on remarquera 
que f applique A sur B, et À, sur B/, et que g”! applique À, sur 
B%. Donc l'application %, coïncidant avec f sur A&UA7 et avec 
g”! sur À ,, est une application biunivoque de tout l’ensemble À sur 
tout l’ensemble B. 

Le théorème est donc démontré. 

6. Notion de puissance d’un ensemble. Si deux ensembles finis 
sont équipotents, ils contiennent le même nombre d'éléments. 
Si deux ensembles équipotents M et NW sont arbitraires, on dit que 
M et W ont la même puissance. Donc, la puissance d’un ensemble 
est ce qu'il y a de commun à cet ensemble et tout autre ensemble 
qui lui est équipotent. Pour les ensembles finis la notion de puis- 
sance coïncide avec la notion familière de nombre d'éléments de 
l’ensemble. On désigne la puissance de l’ensemble des entiers natu- 
rels (et donc de tout ensemble dénombrable) par le symbole No 
(se Lit « aleph zéro »). Quant aux ensembles équipotents à l’ensemble 
des nombres réels du segment [0, 1], on dit qu’ils ont la puissance 
du continu. Cette puissance est désignée par c (ou par le symbole À). 

La question très importante concernant l'existence des puissan- 
ces, comprises entre N, et c, sera abordée plus bas, au $ 4. Les 
ensembles que l’on rencontre en analyse ont d'ordinaire soit la 
puissance No, soit la puissance c. 

Pour les puissances des ensembles finis, c’est-à-dire pour les 
nombres naturels, outre la notion d'égalité, valable pour tous 
les ensembles, nous connaissons en plus les notions « plus grand » 
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et « plus petit ». Il s’agit maintenant d'étendre ces deux dernières 
notions aux ensembles infinis. 

Soient À et B deux ensembles arbitraires. Désignons par m (À) 
et m(B) leurs puissances. 

Formellement, quatre cas sont possibles : 

1. À est équipotent à un sous-ensemble de B et B est équipotent 
à un sous-ensemble de À. 

2. À possède un sous-ensemble équipotent à B, mais B ne pos- 
sède aucun sous-ensemble équipotent à À. 

3. B possède un sous-ensemble équipotent à À, mais À ne pos- 
sède aucun sous-ensemble équipotent à B. 

4, Aucun des deux ensembles ne possède de sous-ensemble 
équipotent à l’autre. 

Dans le premier cas, en vertu du théorème de Cantor-Bernstein, 
les ensembles À et B sont équipotents, c’est-à-dire 


m (4) = m (B). 


Dans le deuxième cas il est naturel de convenir que m (À) > 
> m (B); dans le troisième cas on convient que m (À) << m (B). 

Dans le quatrième cas on devrait considérer les puissances de 
À et B comme incomparables. Mais en réalité ce cas est impossible ! 
Ceci résulte du théorème de Zermelo dont il sera question au $ 4. 
Ainsi donc, quels que soient les ensembles À et B, on a soit m(A) — 
— m (B) (si les ensembles À et B sont équipotents), soit m (A) << m (B), 
soit m (À) > m (B). 

Nous avons remarqué plus haut que les ensembles dénombrables 
sont « les plus petits » parmi tous les ensembles infinis. Puis nous 
avons montré qu'il existe des ensembles infinis ayant « un degré 
d’infinité plus haut »; il s’agit des ensembles qui ont la puissance 
du continu. On se demande maintenant, s’il existe des puissances 
plus grandes que celle du continu. Ou, d’une façon plus générale, 
existe-t-il une puissance qui soit « la plus grande »? La réponse 
se trouve dans le théorème suivant. 


Théorème 3. Soit M un ensemble quelconque et soit M 
l'ensemble ayant pour éléments tous les sous-ensembles de M. Alors 
l’ensemble M a une puissance plus grande que celle de M. 


Démonstration. On voit facilement que la puissan- 
ce m de l’ensemble M ne peut pas être inférieure à la puissance m 
de l’ensemble donné M ; en effet, les singletons !) de M forment 
un sous-ensemble de M, équipotent à M. Il reste donc à démontrer 
que les puissances m et m sont distinctes. Supposons qu'il existe 
une correspondance biunivoque entre les éléments a, b, ... de 
l’ensemble M et certains éléments À, B, ... de l’ensemble M 


1) On appelle ainsi tout ensemble qui comporte un seul élément. 
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(c'est-à-dire certains sous-ensembles de M): 
a À, b<—B, 


Montrons que cette correspondance n’épuise pas l’ensemble 
M. Pour cela, construisons un ensemble XC M ne correspondant 
à aucun élément de M. Soit X l’ensemble des éléments de M n’ap- 
partenant pas aux sous-ensembles qui leur correspondent. D'une 
façon plus détaillée : si a < À et a € À, alors a n'appartient pas 
à À; par contre, si a À et a é À, alors a est considéré comme 
élément de X. Il est clair que X est un sous-ensemble de À et donc 
un élément de M. Montrons que XÀ ne correspond à aucun élément 
de M. Supposons le contraire, c’est-à-dire qu’il existe un élément 
x de M, tel que x <—- X. Voyons, si cet élément appartient ou non 
à X. Supposons que xËé X ; or, puisque, par hypothèse, X contient 
tout élément de M qui n’appartient pas au sous-ensemble qui lui 
correspond, alors x € X. D'autre part, en supposant que x € X, 
on doit en conclure que æ É À, car X ne peut pas contenir un élé- 
ment de M qui appartient au sous-ensemble qui lui correspond. 
Donc, l'élément x considéré doit à la fois appartenir et ne pas appar- 
tenir à À. On en déduit qu'un tel élément ne peut pas exister, 
ce qui prouve qu'il est impossible d'établir une correspondance 
biunivoque entre les éléments de l’ensemble M et tous ses 
sous-ensembles. 

Le théoréme est démontré. 

Quelle que soit la puissance d’un ensemble donné, nous pouvons 
donc construire un ensemble ayant une puissance plus grande, 
ensuite un autre dont la puissance soit encore plus grande, etc. 
Nous obtiendrons de cette façon une échelle de puissances, non 
bornée supérieurement. 

Remarque. On désigne la puissance de l’ensemble M 
par 2”, où m est la puissance de M (le lecteur comprendra sans peine 
le sens de cette notation, en considérant le cas où M est un ensemble 
fini). Le théorème précédent peut être alors exprimé par l'inégalité : 
m2". En particulier, pour m— NN, on obtient l'inégalité 
No < 2X0. Montrons que 2X0 = NN, ou que la puissance de l’ensemble 
des parties de la suite naturelle est égale à la puissance du continu. 

Partageons les sous-ensembles de la suite naturelle en deux 
classes, $ et 6, en mettant dans $ ceux qui ont des complémen- 
taires infinis et dans @ ceux qui ont des complémentaires finis. 
La classe G contient, en particulier, la suite naturelle toute entière, 
car le complémentaire de celle-ci est vide. La classe G est un ensemble 
dénombrable (démontrer!). Elle n’exerce aucune influence sur 
la puissance de l’ensemble M — RU G. 

On peut établir une correspondance biunivoque entre les sous- 
ensembles appartenant à la classe % et les nombres réels « de 
l'intervalle [0, 1). 
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En effet, faisons correspondre à tout sous-ensemble À € $ 
le nombre réel &«, 0<a<1i, ayant le développement dyadique 


€ € £ 
ee 


où €, est égal à { ou à 0, suivant que nr appartient ou non à l’ensemble 
A. La vérification des détails est laissée au lecteur. 


Exercice. Démontrer que l’ensemble des fonctions numériques (ou, plus 
généralement, l’ensemble des fonctions à valeurs dans un ensemble qui contient 
au moins deux éléments), définies sur un ensemble quelconque M, a une 
puissance supérieure à celle de 4. 

Indication. Utiliser le fait que l’ensemble des fonctions caractéristiques 
(c’est-à-dire des fonctions sur M qui ne prennent que deux valeurs: 0 et 1) est 
équipotent à l’ensemble des parties de W. 


$ 4. Ensembles ordonnés. Nombres transfinis 


Dans ce paragraphe on exposera certaines notions liées au con- 
cept d'ordre dans un ensemble. Nous nous bornerons ici aux ren- 
seignements les plus élémentaires; pour un exposé plus détaillé 
on pourra se reporter aux ouvrages indiqués dans la bibliographie 
à la fin de ce livre. 

1. Ensembles ordonnés. Soit M un ensemble quelconque et soit 
æ une relation binaire dans M (définie à l’aide d’un ensemble 
Ro EM X M). On dit que y est une relation d'ordre, si elle vérifie 
les conditions suivantes: 

1) réflexivité açpa, 

2) transitivité: si ab et bœc, alors avc, 

3) antisymétrie: si ab et bœa, alors a = b. 

On convient de noter une relation d'ordre par le symbole <. L’écri- 
ture a < b signifie donc que le couple (a, b) appartient à l’ensemble 
donné À,. Dans ce cas on dit que a est inférieur ou égal à b ou que 
a précède b. Tout ensemble muni d’une relation d'ordre s’appelle 
ensemble ordonné. 

Considérons quelques exemples d’ensembles ordonnés. 

1. Tout ensemble peut être considéré de façon triviale comme 
ordonné, en posant a < b si et seulement si «a — b. Autrement dit, 
on peut toujours prendre comme relation d’ordre dans un ensemble 
la relation binaire d'identité e. Certainement, cet exemple ne pré- 
sente pas un grand intérêt. 

2. Soit M l’ensemble des fonctions continues sur un segment 
[x, fl. En posant f < g si et seulement si f (t)  g (t) pour tous 
les { Ex, Bi, on obtient évidemment une relation d'ordre. 

3. L'ensemble des parties d’un ensemble donné est ordonné 
par la relation d’inclusion: M, < M, signifie que M, M. 

4. L'ensemble des entiers naturels est ordonné, si a & b signifie 
«a divise b ». 
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Soit M un ensemble ordonné quelconque. Lorsque a < b et 
a == b, on utilise le symbole <<, c’est-à-dire on écrit a << b, et 
on dit que a est injérieur à b ou que a précède strictement b. Au lieu 
de a < b on utilise parfois l’écriture équivalente b > a et on dit 
alors que b est supérieur ou égal à a (b est supérieur à a, si b a) 
ou que b suit a. On dit que a € M est un élément maximal de M, 
si a  b implique b — a. De manière analogue, a est dit élément 
minimal de M, si c < a implique c = a. 

Un ensemble ordonné dont n'importe quels deux éléments a et b possèdent 
un suivant c(a < c, b < c) s'appelle ensemble filtrant à droite. 


2. Applications conservant l’ordre. Soient M et M deux ensem- 
bles ordonnés et f une application de dans M”. Nous dirons que 
l'application f conserve l’ordre, si a < b, où a, b € M, implique 
f (a) < jf (b) (dans M”) . On dit que f est un.isomorphisme des ensem- 
bles ordonnés M et M”,sielle est bijective et la relation f (a) < f (b) 
est vérifiée si et seulement si a < b. Les ensembles M et M' sont 
dits alors isomorphes. 

Soient, par exemple, ] l’ensemble des entiers naturels, ordonné 
par la relation de divisibilité (cf. exemple 4, n° 1), et M” le même 
ensemble, ordonné de façon naturelle, c'est-à-dire de façon que 
b > a, si b — a est un nombre positif. Alors, l'application de AZ sur 
M" qui fait correspondre tout entier naturel n à lui-même conserve 
l’ordre (mais n’est pas un isnmorphisme). 

La relation d’isomorphisme des ensembles ordonnés est évidem- 
ment une relation d'équivalence (elle est symétrique, transitive 
et réflexive). Par conséquent, lorsqu'on a une certaine quantité !) 
d’'ensembles ordonnés, on peut toujours les partager en classes 
d’ensembles isomorphes. Il est clair que si ce n’est que l’ordre défini 
dans un ensemble qui nous intéresse et non la nature de ses éléments, 
alors deux ensembles ordonnés isomorphes peuvent être considérés 
comme identiques. 

3. Types d’ordre. Ensembles totalement ordonnés. Lorsque deux 
ensembles ordonnés sont isomorphes, nous dirons qu'ils ont le 
même ’ype d'ordre. Cela signifie que le type d'ordre c’est ce qu’il 
y à de commun aux ensembles ordonnés isomorphes de même que 
la puissance est ce qu’il y a de commun aux ensembles équipotents 
{indépendamment de la relation d'ordre dont chacun de ces ensembles 
est muni). 

Soient a et b deux éléments d’un ensemble ordonné. Il se peut 
qu'aucune des relations a < b et b< a n’ait lieu. Dans ce cas 
on dit que les éléments a et b sont incomparables. Si dans un ensemble 


1) Nous évitons les expressions dans le genre de « tous les ensembles ordon- 
nés », car au fond elles sont, comme l'expression « l’ensemble de tous les ensem- 
bles », contradictoires et donc inadmissibles dans une théorie mathématique 
rigoureuse. 
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ordonné M il existe des éléments incomparables, c’est-à-dire si la 
relation d'ordre est définie seulement pour certains couples d’élé- 
ments de M, on dit que M est partiellement ordonné. Si, par contre, 
dans un ensemble ordonné M il n’y a pas d'éléments incomparables, 
on dit que M est un ensemble totalement ordonné. Autrement dit, 
un ensemble M est totalement ordonné, s’il est ordonné et si pour 
n'importe quels deux éléments distincts a, b € M on a nécessaire- 
ment soit a << b, soit b < a. 

Les ensembles indiqués dans les exemples 1-4, n° 1, ne sont que 
partiellement ordonnés. Les exemples les plus simples d’ensembles 
totalement ordonnés sont fournis par l’ensemble des nombres natu- 
rels, l’ensemble des nombres rationnels, l’ensemble des nombres 
réels du segment [0, 1], etc. (munis des relations naturelles « plus 
grand » et « plus petit », propres à ces ensembles). 

Il est clair que tout sous-ensemble d’un ensemble totalement 
ordonné est lui-même un ensemble totalement ordonné. 

Comme l’ordre total est un cas particulier de la notion d'ordre, 
on peut appliquer aux ensembles totalement ordonnés la notion 
d'application conservant l’ordre et, en particulier, la notion d’iso- 
morphisme. On peut donc parler du type d’ordre d’un ensemble 
totalement ordonné. 

La suite des nombres naturels 4, 2, 3, . .., munie de la relation 
naturelle d'ordre, représente le plus simple exemple d’ensemble 
totalement ordonné infini. On désigne son type d'ordre par ©. 

Si deux ensembles ordonnés sont isomorphes, ils ont certainement 
la même puissance (l’isomorphisme est une bijection). Donc, on peut 
parler de la puissance qui correspond au type d’ordre donné (par 
exemple, la puissance qui correspond au type æ est No). La réci- 
proque n’est pas vraie: un ensemble de puissance donnée peut être 
ordonné, en général, de beaucoup de manières différentes. Seule- 
ment dans le cas d’un ensemble totalement ordonné fini le type 
d’ordre est déterminé de façon unique par le nombre n des éléments 
de cet ensemble (on le désigne aussi par n). Mais déjà dans le cas 
de l’ensemble dénombrable des entiers naturels, outre le type « na- 
turel >» w, on peut envisager, par exemple, le type: 


1,3, 9,..., 2, 4, 6, ..., 


où tout nombre impair précède tous les nombres pairs, l’ensemble 
des nombres impairs et celui des nombres pairs, pris à part, étant 
ordonnés par croissance. On peut montrer que l’ensemble des types 
d'ordre distincts qui correspondent à la même puissance No, est 
infini et même qu'il est non dénombrable. 

4. Somme ordinale d’ensembles totalement ordonnés. Soient M, 
et M, deux ensembles totalement ordonnés disjoints dont les types 
d'ordre sont respectivement ©, et @.. Dans la réunion HW, JM; on 
peut définir une relation d'ordre total, en considérant tout 
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élément de M, comme précédant tout élément de M, l’ordre 
dans M, et M; étant laissé inchangé (vérifier que c’est bien une 
relation d'ordre total!). L'ensemble totalement ordonné ainsi 
obtenu est appelé somme ordinale des ensembles M, et M, et noté 
M, + M. Il importe de souligner que l’ordre des termes ici n’est 
pas indifférent : la somme ordinale M, + M, n’est pas, en général, 
isomorphe à la somme ordinale M, + M2. 

Le type d'ordre de M, + M, est appelé somme ordinale des types 
O, et ®, et noté O, + O. 

Cette définition peut être facilement étendue à un nombre fini 
arbitraire de termes @,, @>, ..., 0. 

Exemple. Considérons les types d'ordre w et n. On voit 
immédiatement que nr + © = w; en effet, lorsqu'on ajoute à la 
suite naturelle 1, 2, 3, ..., k, ... un nombre fini de termes 
à sa gauche, on obtient le même type d'ordre w. D'autre part, le 
type d'ordre &@ + n, c'est-à-dire le type d'ordre de l’ensemble 


À, 2, 3, . k, . +. dis Œo;, . An 


n’est pas égal à «©. 

9. Ensembles bien ordonnés. Nombres transfinis. Plus haut nous 
avons introduit la notion d'ordre, puis la notion d’ordre total. 
Introduisons maintenant la notion encore plus étroite, mais très 
importante, de bon ordre. 

Définition. Un ensemble totalement ordonné M s'appelle 
bien ordonné, si tout sous-ensemble non vide de M possède un plus 
petit élément (c’est-à-dire un élément qui précède tous les éléments 
de ce sous-ensemble). 

Lorsqu'un ensemble totalement ordonné est fini, il est évidem- 
ment bien ordonné. Un exemple d’ensemble totalement ordonné 
qui n’est pas bien ordonné est fourni par l’ensemble des nombres 
réels du segment [0,1]. Cet ensemble possède un plus petit élément : 
le nombre 0, mais son sous-ensemble formé par les nombres posi- 
tifs n'a pas de plus petit élément. 

Il est clair que tout sous-ensemble (non vide) d'un ensemble bien 
ordonné est également bien ordonné. 

Le type d'ordre d’un ensemble bien ordonné s'appelle nombre 
ordinal (nombre ordinal transfini ou simplement transfini, si l’on 
veut souligner qu'il s’agit d’un ensemble infini). 

La suite naturelle (munie de la relation naturelle d’ordre) est 
un ensemble non seulement totalement ordonné, mais encore bien 
ordonné. Par conséquent, son type d'ordre «w est un nombre ordinal 
(un transfinil). Le type d'ordre © + X de l’ensemble 


4, 2, ._. … n, di, do, . ŒR 


est également un nombre ordinal 
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Par contre, l’ensemble 
ss — HN...) —9,—2, —1À (1) 


est totalement ordonné, mais non bien ordonné. Chaque sous-ensem- 
ble non vide de (1) possède un plus grand élément (c’est-à-dire un 
élément qui suit tous les autres), mais ne possède pas, en général, 
un plus petit élément (par exemple, l’ensemble (1) lui-même n’a 
pas de plus petit élément). On convient de désigner le type d'ordre 
de l’ensemble (1) (qui n’est pas un nombre ordinal!) par le sym- 


bole oœ*. 
Démontrons la proposition simple, mais importante, qui suit. 


Lemme 1. La somme ordinale d'un nombre fini d’ensembles 
bien ordonnés est un ensemble bien ordonné. 


En effet, soit M un sous-ensemble quelconque de la somme ordi- 
nale M, + M: +...+ M, de n ensembles bien ordonnés; soit 
M} le premier de ces ensembles qui contient des éléments de M. 
L’intersection de M et M, est un sous-ensemble (non vide) de l’en- 
semble bien ordonné M, et possède donc un plus petit élément. 
Cet élément est aussi le plus petit dans M. 

Corollaire. La somme ordinale de plusieurs nombres ordi- 
naux est un nombre ordinal. 

Ainsi donc, à partir d’une quantité donnée de nombres ordinaux, 
on peut construire de nouveaux nombres ordinaux. Par exemple, 
à partir des nombres naturels (c’est-à-dire des nombres ordinaux 
jinis) et du nombre ordinal ©, on peut obtenir les nombres ordinaux 


o+n, o+o, o+o<+tn, o—+oœ<+o, etc. 


Le lecteur construira sans difficulté des ensembles bien ordonnés 
correspondant à ces transfinis. 


Au n°4 nous avons introduit la notion de somme ordinale de types d'ordre. 
On peut introduire de même la notion de produit ordinal. Soient M4 et M; deux 
ensembles totalement ordonnés ayant les types d'ordre @, et @2. Prenons un, 
nombre suffisamment grand d'exemplaires de l’ensemble M,, plus précisément, 
un pour chaque élément de M>:, et remplaçons les éléments de M2 par ces exem- 
plaires de M1. L'ensemble ainsi obtenu est appelé produit ordinal de M1 et Ma et 
noté M,-M2. Formellement, M,-M2 représente l'ensemble des couples (a, b) 
avec a € MA et b € M2, ordonné de façon que (ay, b4) << (az, b2), si b4 be 
(quels que soient a4, a2,) et (ay, b) (az, b), si ay a. 

De manière analogue on définit le produit ordinal d'un nombre fini arbi- 
traire de facteurs M,M2 ...M,. Le type d'ordre 6 du produit M;-M, des ensem- 
bles totalement ordonnés M, et M: est appelé produit ordinal des types d'ordre 


O, ct ®: : 
0 — 6,-02. 
Le produit ordinal, de même que la somme ordinale, n’est pas commutatif. 


Lemme 2 Le produit ordinal de deux ensembles bien ordonnés est un 
ensemble bien ordonné, 
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Démonstration. Soit M un sous-ensemble du produit M,:M:; 
M est un ensemble de couples (a, b). Considérons tous les seconds éléments b des 
couples appartenant à M. Ils forment un sous-ensemble de M2. Comme M, est 
bien ordonné, ce sous-ensemble possède un plus petit élément. Notons-le par b5 
et considérons tous les couples de la forme (a, b,) appartenant à M. Leurs 
premiers éléments a forment un sous-ensemble de M,. Comme M4 est bien ordon- 
né, parmi ces éléments il existe un plus petit. Notons-le par a,. Alors le couple 
(ao, bo), comme on le voit facilement, est le plus petit élément de M. 

orollaire. Le produit ordinal de plusieurs nombres ordinaux est un 

nombre ordinal. 

Exemples. Ilest aisé de voir que © + © = &@-2, © + © + © = &-3. 
De même, il est facile de construire des ensembles bien ordonnés dont les types 
d'ordre soient œ@-n, @?, @?-n, @°,..., @?,... Tous ces ensembles seront 
dénombrables. 

On peut définir aussi d’autres opérations sur les types d'ordre, par exemple, 


l'élévation à une puissance, et considérer des nombres ordinaux comme &°, 
Ho, etc. 

6. Comparaison des nombres ordinaux. Si nr, et nr, sont deux 
nombres ordinaux finis, on a toujours l’une des possibilités suivan- 
tes: ou ces deux nombres sont égaux, ou l’un d’eux est plus grand 
que l’autre. Etendons cette relation d’ordre au cas des nombres 
ordinaux transfinis. 

Pour cela, introduisons les notions suivantes. Tout élément 
a d’un ensemble totalement ordonné M définit dans M une section 
commençante P (l’ensemble des éléments inférieurs à a) et une section 
finissante Q (l’ensemble des éléments supérieurs ou égaux à a). 

Soient &« et B deux nombres ordinaux et soient M et N deux 
ensembles de types d’ordre respectifs & et B. Nous dirons que: 
a — $, si les ensembles M et N sont isomorphes, à << $, si M est 
isomorphe à une section commençante de W, et « => f, si, inverse- 
ment, /V est isomorphe à une section commençante de M. 


Théorème 1. Quels que soient les nombres ordinaux «& et 
B, on a soit à = $, soit a << B, soit a > f. 


Pour la démonstration on établira d’abord le lemme suivant. 


Lemme 3. Si f est une application isomorphe de l’ensemble 
bien ordonné À sur un sous-ensemble quelconque BEA, on af(a)>a 
pour tous les a € À. 


En effet, s’il y a des éléments a€A tels que f (a) < a, il existe 
parmi eux un plus petit (en vertu du bon ordre!). Désignons cet 
élément par ao et posons bo = f (ao). Alors, b, << ao et, comme 
l'application f est isomorphe, on doit avoir f (bo)  f (ao) = Vo, 
ce qui est impossible, as étant le plus petit des éléments qui possè- 
dent la propriété indiquée. 

De ce lemme il résulte immédiatement qu’un ensemble bien 
ordonné ne peut pas être isomorphe à sa section commençanie. 
Si l’ensemble À était isomorphe à sa section commençante définie 
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par l'élément a, on aurait f (a) a. Donc, on ne peut pas avoir 
à la fois 
a=$ et a <$f. 


Pour la même raison on ne peut pas avoir simultanément « = $ 
et œ >$. Les relations 


afp et a >œ$ 


sont également incompatibles, sinon on aurait (par transitivité |!) 
a << «4, ce qui est impossible, ainsi qu’on vient de le voir. Nous 


’ < 
avons montré donc que chacune des relations &« = f exclut les 


deux autres. Montrons à présent que l’une de ces relations a tou- 
jours lieu, c'est-à-dire que n'importe quels deux nombres 
ordinaux sont comparables. 

Construisons d’abord pour chaque nombre ordinal &« un ensem- 
ble W («), lui servant de «représentant standardisé ». Notamment, 
prenons pour W (x) l’ensemble des nombres ordinaux inférieurs à @. 

Tous les nombres ordinaux qui font partie de W (x) sont deux 
à deux comparables et l’ensemble W (x) (ordonné selon les valeurs 
des nombres ordinaux) a le type d’ordre «. En effet, si l’ensemble 


A={..,a,...,0b,...)} 


a le type d'ordre &, par la définition même, les nombres ordinaux 
inférieurs à & se trouvent en correspondance biunivoque avec les 
sections commençantes de l’ensemble À et donc avec les éléments 
de cet ensemble. Autrement dit, les éléments d’un ensemble dont 


le type d’ordre est &« peuvent être numérotés à l’aide des nombres 
ordinaux inférieurs à «: 


À ={ay, &, - .., An, . . .}. 


Soient maintenant & et B deux nombres ordinaux; alors les 
ensembles À = W (œ) et B — W (B) ont respectivement les types 
d'ordre « et B. Soit ensuite C = À f} B l'intersection des ensembles 
À et B, c’est-à-dire l’ensemble des nombres ordinaux inférieurs à « 
et à B à la fois. L'ensemble C est bien ordonné. Désignons son type 
d'ordre par y et montrons que y < &. En effet, si C = À, on a y — 
— à; par contre, si € = À, alors C est une section commençante 
de À et donc 

Y < «a. 


En effet, quels que soient £ € Cet n € AC, les nombres ordinaux Ë 


et "n sont comparables, c’est-à-dire on a Ë S n. Or, la relation n < 
<T Ë << «à est impossible, sinon on devrait avoir n € C. Par consé- 
quent, Ë  n, ce qui montre que C’est une section commençante de À 
et donc y  &. En outre, y est le plus petit élément de l’ensemble 
ANXC. On a donc y < « et, par analogie, y < f$. 
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Notons encore que le cas y  «, y << $ est impossible, sinon on 


devrait avoir 
YEANC, YEBX\C, 


ce qui signifierait d'une part que y 6 C et d’autre part que YE€ 
EAN B = C. Par conséquent, on ne peut avoir que les cas suivants: 


Y =, y = , a = À, 
V=a, Y<P, a <h, 
Y<A Y=$, a >, 


ce qui prouve que «a et $ sont comparables. Le théorème est donc 
complètement démontré. 

Pour tout nombre ordinal il existe une puissance bien déterminée 
qui lui correspond et la comparabilité des nombres ordinaux entraîne, 
évidemment, la comparabilité des puissances correspondantes. En 
d’autres termes : 

Si À et B sont deux ensembles bien ordonnés, alors ou bien ils sont 
équipotents, ou bien la puissance de l’un est plus grande que la puissance 
de l’autre (c'est-à-dire deux ensembles bien ordonnés ne peuvent 
pas avoir des puissances non comparables). 

Considérons tous les nombres ordinaux qui correspondent à des 
puissances finies ou dénombrables. Ils forment un 
ensemble bien ordonné. On se convainc aussitôt que cet ensemble 
n'est pas dénombrable. En effet, conformément aux 
notations usuelles, désignons par w, le type d'ordre de l’ensemble des 
transfinis dénombrables. Si la puissance qui lui correspond était 
dénombrable, il en serait de même de l’ensemble ayant le type d’or- 
dre w, + 1. Cependant, il est évident que w, suit tous les transfinis 
dont les puissances correspondantes sont finies ou dénombrables. 

Désignons par le symbole NN, la puissance qui correspond au 
nombre ordinal transfini w,. On voit aisément qu'il n'existe aucune 
puissance m telle que 


No << Ni: 


En effet, si une telle puissance m existait, l’ensemble W (w,) des 
nombres ordinaux transfinis qui précèdent w, contiendrait un sous- 
ensemble de puissance m. Un tel sous-ensemble est bien ordonné et 
non dénombrable. Mais alors son type d'ordre & précéderait ©, et, 
en même temps, suivrait tous les transfinis dénombrables. Or, ceci 
serait en contradiction avec la définition de «4. 

7. Axiome du choix, théorème de Zermelo et leurs équivalents. 
La comparabilité des ensembles bien ordonnés suivant leur puissance 
nous amène à poser la question suivante: est-il possible que tout 
ensemble soit rendu d’une manière quelconque bien ordonné? La 
réponse affirmative signifierait, en particulier, qu'il n’existe pas de 
puissances non comparables. Une telle réponse a été donnée par 
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Zermelo qui a démontré que tout ensemble peut être rendu bien ordonné. 
La démonstration de ce théorème (que nous ne reproduisons pas ici, 
cf. par exemple, [2]) est basée essentiellement sur la proposition 
que l’on appelle axiome du choix et qui consiste en ceci. 

Soit À un ensemble d'indices « et supposons qu’à chaque indice «& 
on ait fait correspondre un ensemble quelconque M,. Alors l’axiome 
du choix affirme qu'il est possible de définir sur À une fonction 
faisant correspondre à tout à« € À un élément m, de l’ensemble corres- 
pondant M,. Autrement dit, on peut former un ensemble, en choisis- 
sant dans chaque M, un élément et un seul. 

La théorie des ensembles, telle qu'elle est traitée ici, remonte à Cantor et 
Zermelo et représente ce qu’on appelle la théorie « naïve » des ensembles. L’axio- 
me du choix, appelé aussi axiome de Zermelo, apparut dans le cadre de cette 


théorie avec d’autres questions, comme l'hypothèse du continu, 
c'est-à-dire la question de savoir si la puissance du continu coïncide avec la 


première puissance non dénombrable NN: : il donna lieu à de nombreuses discus- 
sions et fit apparaître une longue série de travaux sur la logique mathématique 
et les fondements des mathématiques. Notons, en particulier, la création des 
théories axiomatiques de Güôdel-Bernays et Zermelo-Fraenkel. Dans les limites 
de ces théories on a établi la non-contradiction et l’indépendance de l’axiome du 
choix. Le lecteur pourra se reporter aux ouvrages spécialisés: A. Fraenkel, 
I.Bar-Hillel «Foundations of set theory », Amsterdam, 1958; P. J.Co- 
hen «Set theory and the continuum hypothesis », New-York-Amsterdam, 
4966. Notons qu’en renonçant à l’axiome du choix, on appauvrit considérable- 
ment le contenu de la théorie des ensembles. 

Cependant, la critique de la théorie « naïve » des ensembles et les tentati- 
ves de se passer de l’axiome du choix ont conduit à la création des théories si 
remarquables comme la théorie des fonctions récursives et des notions comme celle 
de nombre calculable. 


Nous énoncerons ici quelques propositions dont chacune est 
équivalente à l’axiome du choix (c’est-à-dire chacune d'elles peut 
être démontrée, si l’on admet l’axiome du choix, et réciproquement, 
l’axiome du choix peut être démontré, en admettant l’une quelconque 
de ces propositions). Il est clair avant tout que le théorème de Zerme- 
lo est lui-même une telle proposition. En effet, en supposant chaque 
ensemble M, bien ordonné, pour construire la fonction dont l’exis- 
tence est affirmée dans l’axiome du choix, il suffit de prendre dans 
chaque M, le plus petit élément. 

Pour énoncer d’autres propositions équivalentes à l’axiome du 
choix, introduisons les notions suivantes. Soit M un ensemble or- 
donné. Tout sous-ensemble À € M dont n'importe quels deux élé- 
ments sont comparables (au sens de l’ordre défini dans M) est appelé 
chaîne. La chaîne est appelée maximale, si elle n’est pas contenue 
comme partie propre dans une autre chaîne de M. L'élément a de 
l’ensemble ordonné M est appelé majorant du sous-ensemble M € M 
si tout élément a” € M” précède a. 


Théorème de Hausdorîff. Dans un ensemble ordonné 
toute chaîne est contenue dans une chaîne maximale. 
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La proposition suivante fournit le plus commode des énoncés 
équivalents à 


à l’axiome du choix. 
Lemme de Zorn. Si dans un ensemble ordonné M toute 
chaîne admet un majorant, alors tout élément de M précède un élément 
maximal. 


Une démonstration de l’équivalence de toutes ces propositions 
(axiome du choix, théorème de Zermelo, théorème de Hausdorff, 
lemme de Zorn) est donnée, par exemple, dans le livre de À. Ku- 
rosh « Leçons d’algèbre générale » cf. aussi [8]. Nous ne la repro- 
duirons pas ici. 

Si l’ensemble des majorants du sous-ensemble À possède un plus petit 
élément a, on dit que a est La borne supérieure de À ; de manière analogue on défi- 
nit la borne inférieure de A. L’ ensemble ordonné dont toute partie finie non vide 
admet une borne supérieure et une borne inférieure est appelé treillis. 

8. Récurrence transfinie. L’une des méthodes de démonstration 
les plus répandues est la méthode de démonstration par récurrence. 
Elle consiste, comme on le sait, dans ceci. Soit P (n) une proposition 
qui s’énonce pour chaque entier naturel n et supposons qu’on sache 
que : 

1) la proposition P (1) est vraie; 

2) le fait que P (k) est vraie pour tous les Æ < n entraîne que 
P (n + 1) est aussi vraie. 

Alors la proposition P (n) est vraie pour tous les n = 1, 2, 

En effet, dans le cas contraire, parmi les nombres n tels que P (n) 
est fausse il existerait un plus petit, soit n,. Or, il est clair que n, > 
> 1, c’est-à-dire que nr, — 1 est aussi un nombre naturel et on obtient 
donc une contradiction avec la condition 2). 

Une méthode analogue peut être appliquée, en remplaçant la suite 
naturelle par un ensemble bien ordonné quelcon- 
que. Dans ce cas elle s'appelle méthode de la récurrence transfinie. 
Ainsi, la méthode de la récurrence transfinie consiste dans ceci. Soit 
un ensemble bien ordonné quelconque À (éventuellement, l’ensemble 
des nombres ordinaux transfinis, inférieurs à l’un quelconque) et 
soit P (a) une proposition quelconque, énonçable pour tout a € À 
et telle que P (a) soit vraie pour le plus petit élément de À et vraie 
pour a, lorsqu'elle est vraie pour tous les éléments qui précèdent a. 
Alors P (a) est vraie pour tous les a € À. 

En effet, si dans À il y avait des éléments a tels que LP (a) soit 
fausse, l’ensemble de tels éléments posséderait un plus petit, soit a*, 
et on aboutirait à une contradiction, car pour tout a << a* la pro- 
position P (a) serait vraie. 

Comme d’après le théorème de Zermelo tout ensemble peut être 
rendu bien ordonné, la récurrence transfinie peut être appliquée. 
en principe, à n'importe quel ensemble. Toutefois, en pratique, il 
est souvent plus commode de se servir du lemme de Zorn qui exige 
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seulement que l’ensemble considéré soit ordonné. Or, pour les objets 
considérés dans les problèmes qui font appel au lemme de Zorn il 
existe d'habitude un ordre qui apparaît de façon naturelle, « de 
soi-même ». 


$ 5. Familles d’ensembles 


1. Anneau d’ensembles. On appelle famille d'ensembles tout 
ensemble dont les éléments sont eux-mêmes des ensembles. Sauf 
mention du contraire, nous ne considérerons que des familles d’en- 
sembles dont chacum est une partie d’un certain ensemble 
référentiel X. Les familles d’ensembles seront désignées par des 
lettres majuscules de l’alphabet allemand. Nous nous intéresserons 
principalement aux familles d’ensembles, closes par rapport à cer- 
taines opérations introduites au $ 1. 

Définition 1. Une famille d’ensembles non vide À est 
appelée anneau, si elle possède la propriété que AE et BEM 
impliquent AABERet ANBEN. 

Comme pour deux ensembles arbitraires À et B on a toujours 


AUB—=(4AB)A(AN P) 
et 
AXB = AA(A MN BP), 


on en déduit que les relations À ER et BEN impliquent aussi 
A UBER et AXB ER. Donc, l’anneau d’ensembles est une famille 
d’ensembles, close par rapport à la réunion, à l’intersection, à la 
soustraction et à la différence symétrique de deux ensembles. Il est 
évident qu’un anneau d’ensembles est clos aussi par rapport à la 
réunion et à l’intersection d’un nombre fini arbitraire d’ensembles : 


nr n 
C= 1 A4, D=f) Az. 
k=1 k—1 


Tout anneau d’ensembles contient l’ensemble vide @, car on 
a toujours A B = G. La famille qui ne contient que l’ensemble vide 
représente le plus petit anneau d’ensembles. 

L'ensemble Æ s'appelle unité de la famille d'ensemble ©, si 
E EG et pour tout A EG on a 


À N £ = À. 


Ainsi, l’unité d’une famille d’ensembles @ n’est autre chose que 


l’ensemble maximal de cette famille contenant tous les autres en- 
sembles de G. 


}) Les notions considérées dans ce paragraphe nous seront indispensables au 
chap. V lors de l’exposition de la théorie générale de la mesure. C’est pourquoi 
la lecture de ce paragraphe peut être reportée au plus tard. Le lecteur qui ne 
s'intéresse qu’à la théorie de la mesure sur le plan ($ 1, chap. V) pourra omettre 
entièrement ce paragraphe. 
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Un anneau d’ensembles avec unité s'appelle algèbre d’ensembles. 

Exemples. 1. Quel que soit l’ensemble À, la famille 
M (A) de tous ses sous-ensembles est une algèbre d’ensembles dont 
l'unité £ = À. 

2. Quel que soit l’ensemble non vide À, la famille {A,g } consti- 
tuée par l’ensemble À et l’ensemble vide @ est une algèbre d’ensem- 
bles dont l’unité £ — À. 

3. La famille des sous-ensembles finis d’un ensemble quelcon- 
que À est un anneau d’ensembles. Cet anneau est une algèbre si et 
seulement si l’ensemble À est lui-même fini. 

4. La famille de tous les sous-ensembles bornés de la droite numé- 
rique est un anneau d’ensembles sans unité. 

De la définition de l’anneau d’ensembles on déduit immédiate- 
ment la propriété suivante. 


Théorème 1. L’'intersection À — A Ra de tout ensemble 
œ 
d'anneaux est un anneau. 


Le résultat qu’on va établir maintenant est simple, mais impor- 
tant pour la suite. 


Théorème 2. Pour toute famille non vide d'ensembles © 
il existe un anneau et un seul $ (©) contenant G et inclus dans tout 
anneau À qui contient €. 


Démonstration. Il est aisé de voir que l'anneau À est 
défini par la famille & de façon unique. Pour démontrer son existence 
considérons la réunion X = [J À de tous les ensembles À appartenant 


A€cG 
à G et l’anneau Nt (X) des sous-ensembles de X. Soit Z l’ensemble de 
tous les anneaux d’ensembles contenus dans M (X) et contenant €. 
L’intersection 
=nñ 


Nes 


de tous ces anneaux est justement l’anneau cherché À (©). 

En effet, quel que soit l’anneau $* contenant ©, l'intersection 

R — R* AN M (X) est un anneau de Z et donc 

Goheh*, 
c'est-à-dire $ vérifie effectivement la condition de minimalité. 
Cet anneau est appelé anneau minimal sur @ ou anneau engendré par 
& et désigné par R (©). 

2. Demi-anneau d’ensembles. Dans certaines questions, par 
exemple, dans la théorie de la mesure, un rôle important est joué 
non seulement par la notion d’anneau, mais aussi par la notion plus 
générale de demi-anneau d’ensembles. 

Définition 2. Une famille d’ensembles © est appelée 
demi-anneau, si elle contient l’ensemble vide @, est close par rapport 
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à l'intersection et possède la propriété suivante : si les ensembles À 
et A, À appartiennent à ©, alors À peut être mis sous la forme 
n 


A — |} À, où À, sont des ensembles deux à deux disjoints de © 


dont le premier est l’ensemble donné À.. 

Par la suite, toute famille d’ensembles deux à deux disjoints 
A1, À», .: .., An, dont la réunion est égale à l’ensemble donné À, 
sera appelée décomposition finie de l’ensemble À. 

Tout anneau d’ensembles $ est un demi-anneau, car si À et 
À, « À appartiennent à À, on a la décomposition 


— À, U 42, où A, — AXA, EN. 


Comme exemple de demi-anneau qui n’est pas un anneau on peut 
considérer l’ensemble de tous les intervalles ouverts (a, b), fermés 
[a, bl et semi-ouverts (semi-fermés) la, b) et (a, b] de la droite numé- 
rique !). Un autre exemple est donné par l’ensemble des rectangles 
« semi-ouverts » a<z<b,c<y< d du plan, ou par l’ensemble 
des parallélépipèdes semi-ouverts de l’espace. 

Etablissons les propriétés suivantes des demi-anneaux d’en- 
sembles. 


Lemme 1. Soient À,, A», ..., A, et À des ensembles apparte- 
nant au demi-anneau ©. Si les ensembles À; sont deux à deux disjoints 
et tous inclus dans À, la collection des ensembles À; (i — 1, 2, ..., n) 
peut être complétée par des ensembles A,41, . .., Às € © jusqu'à une 
décomposition finie 


A= Ü A(s>») 
hk—1 


de l’ensemble À. 


Démonstration. Démontrons le lemme par récurrence. 
Pour n = 1 l’affirmation du lemme découle de la définition du demi- 
anneau. Supposons que cette affirmation soit vraie pour nr = m et 
considérons m — 1 ensembles À4,, ..., A», Am:1 vérifiant les 
conditions du lemme. Par l'hypothèse de récurrence 


A = AU AU... U Am U Bi U Bo... U PB, 


où tous les ensembles B, (q = 1, 2, ..., p) appartiennent à €. 
Posons 


Bar = Amy n B3. 
D'après la définition du demi-anneau on a la décomposition 


Bs = Ba U Bo .…. U Bar 


1) Y compris, bien sûr, l’intervalle « vide » (a, a) et le segment constitué 
d'un seul point [a, al. 
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où tous les B,; appartiennent à @. On voit sans peine que 
p ‘’q 
A= A; Ù ... U 4m U Am U U CU, Bai). 
g= 2= 


Ainsi, l'affirmation du lemme est démontrée pour n = m + 1, 
donc pour tous les n. 


Lemme 2. Quelle que soit la famille finie d'ensembles À,, ... 
..., À, appartenant au demi-anneau ©, il existe dans © une famille 
finie d’ensembles deux à deux disjoints B,, . .., B;, telle que chaque 
ensemble À, peut être mis sous forme d’une réunion 


Az — Ù PB: 
SEM}, 


de quelques-uns des ensembles B:. 
Démonstration. Pour n — 1 le lemme est évident: il 
suffit de poser { = 1 et B, — À,. Supposons qu'il soit vrai pour 


n — m et considérons dans @ une famille d’ensembles 4,, ..., Am, 
Am+1. Soient B;,, B2, . . ., B; les ensembles de © qui vérifient les 
conditions du lemme pour À,, À», ..., An. Posons 


Bs1 = Am+1 N Ds. 


En vertu du lemme 1 on a la décomposition 
L q 
Ama= U Ba U U, Br B,€G, (1) 
S—= P= 


d’après la définition même du demi-anneau on a la décomposition 
Bs= Bsi U Bsz U ++. U Bis Bs5€G. 


Il est aisé de voir que 


fs 
Az = U U Bsj, k = 1, 2, CCE m 
se M}, j=1 


et que les ensembles 
Ps; B; 


sont deux à deux disjoints. Donc, les ensembles B.;, B, vérifient les 
conditions du lemme pour 44, ..., Am; Am+1. Le lemme est 
démontré. 

3. Anneau engendré par un demi-anneau. Nous avons déjä vu 
au n° 4 que pour chaque famille d’ensembles & il existe un anneau 
minimal unique contenant @. Cependant, pour une famille arbitraire 
G la construction effective de l’anneau $ (©) est assez compliquée. 
Par contre, elle est nettement réalisable dans le cas important, où # 
est un demi-anneau. Cette construction est indiquée par le théorème 
suivant. 
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Théorème 3. Si Gest un demi-anneau, alors N (©) coïncide 
avec la famille 3 des ensembles À dont chacun admet une décomposition 
de la forme 


— U A, An EG. 


Démonstration. Montrons que la famille 8 est un an- 
neau. Si À et B sont deux ensembles quelconques de 3, on a les 
décompositions 


À — Ù Ai, B— U B5 Aie, B;E€. 
i=1 j= 


Comme & est un demi-anneau, les ensembles 
Ci5 = AifN B; 


appartiennent aussi à ©. En vertu du lemme 1 on a les décompositions 
T; S; 

Ai= UCijÙ U, Dis; B;j=UCiÙU Ü E ;1, (2) 
3 = i = 


où les ensembles D;, et E;, appartiennent à ©. Des égalités (2) il 
résulte que les ensembles À N] B et À A B admettent les décomposi- 
tions suivantes 


ANB=NCi, AAB=UÙ D: U UE: 
À, 1 1,R 3,1 


et donc appartiennent aussi à 8. Ainsi 8 est bien un anneau; sa 
minimalité parmi tous les anneaux contenant © est évidente. 

4. 6-algèbres. Dans beaucoup de questions et en particulier 
dans la théorie de la mesure, on est amené à considérer des réunions 
et des intersections non seulement d’un nombre fini, mais aussi 
d’une infinité dénombrable d’ensembles. C’est pourquoi il convient 
d'introduire, outre la notion d’anneau d’ensembles, encore les notions 
suivantes. 

Définition 3 Un anneau d’ensembles est appelé o-anneau, 
si avec toute suite d’ensembles À,, A», ..., À,, ... il contient 
aussi leur réunion 


S — Ù An. 

Définition 4 Un anneau d’ensembles est appelé ô-an- 
neau, si avec toute suite d’ensembles À4,, A4,, ..., An, ... il 
contient aussi leur intersection 

D — N An. 
ñn 


Il est naturel d'appeler o-algèbre tout o-anneau avec unité et 
Ô-algèbre tout Ô-anneau avec unité. Mais on voit facilement que ces 
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deux notions coïncident : toute o-algèbre est en même temps une 
Ô-algèbre et toute 6-algèbre est une o-algèbre. Ceci résulte des rela- 
tions de dualité : 


Ü An=ENx N (E X Ah), 
n An=Ex U (EX An) 
(cf. $ 1). 


L'exemple le plus simple de o-algèbre est fourni par l’ensemble 
des parties d’un ensemble quelconque À. 

Lorsqu'on a une famille d’ensembles quelconque ©, il existe 
toujours au moins une o-algèbre contenant cette famille. En effet, 
posons 

X— |) À 
A€G 


et considérons la famille $ des parties de l’ensemble X. Il est clair 

que $ est une o-algèbre contenant ©. Si $ est une o-algèbre arbi- 

traire contenant © et X est son unité, alors tout ensemble À € © 

est inclus dans X et, par conséquent, X — |) À € X. Nous dirons 
A€G 

que $ est une o-algèbre irréductible (par rapport à la famille ©), 


ut 


si À — U 4 Autrement dit, la o-algèbre irréductible est une 
A€ 
6-algèbre qui ne contient pas de points n’appartenant à aucun 
A EG. Il est naturel de considérer dans chaque cas seulement des 
o-algèbres de cette sorte. 
Pour les o-algèbres irréductibles on a un théorème analogue au 
théorème 2, démontré plus haut pour les anneaux. 


Théorème 4. Pour toute famille d'ensembles non vide G il 
existe une ©-algèbre irréductible (par rapport à cette famille) $ (©) 
contenant S et incluse dans toute o-algèbre qui contient &. 


La démonstration est exactement la même que celle 
du théorème 2. La o-algèbre $ (©) s'appelle o-algèbre minimale sur 
la famille €. 

En analyse un rôle important jouent les ensembles appelés boré- 
liens ou B-ensembles. Ce sont les ensembles de la droite numérique 
qui appartiennent à la o-algèbre minimale sur l’ensemble de tous les 
segments [a, bl. 

5. Familles d’ensembles et applications. Signalons les faits 
suivants qui nous seront utiles lors de l’étude des fonctions mesu- 
rables. 

Soit y — f (x) une fonction définie sur l’ensemble M et à valeurs 
dans l’ensemble V et soit M une famille quelconque de parties de 
l’ensemble M. Désignons par f (Nt) la famille des images f (A) des 
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ensembles appartenant à Mt. Soient, d'autre part, Ÿ une famille 
quelconque de parties de WV et f-! (f) la famille des images récipro- 
ques f”! (À) des ensembles de J. Alors on a les propositions suivantes, 
dont la vérification est laissée au lecteur : 

1) Si À est un anneau, 7! (J) est aussi un anneau. 

2) Si À est une algèbre, f-! (M) est aussi une algèbre. 

3) Si À est une o-algèbre, f-! (J) est aussi une o-algèbre. 

4) RG (N)) = F7 (RC). 

9) (7 (R)) = j7 (BR). 
Ces propositions restent-elles vraies, si l’on remplace f-! par f et 


R par M? 


CHAPITRE II 


Espaces métriques 
et topologiques 


$ 1. Notion d’espace métrique 


1. Définition et exemples. L’une des opérations les plus importan- 
tes de l’analyse est le passage à la limite. Cette opération est basée 
sur la notion de distance entre deux points, définie sur la droite 
numérique. De nombreux faits fondamentaux de l’analyse ne 
sont pas liés à la nature algébrique des nombres réels (c’est-à-dire 
au fait qu'ils forment un corps) et sont basés seulement sur la notion 
de distance. En généralisant l’idée des nombres réels comme d’un 
ensemble muni de distance, on est conduit à la notion d'espace 
métrique qui représente l’une des notions les plus importantes 
des mathématiques modernes. Nous exposerons ici, dans ses traits 
fondamentaux, la théorie des espaces métriques et de leur générali- 
sation: les espaces topologiques. Les résultats de ce chapitre sont 
nécessaires pour toute la suite. 

Définition. On appelle espace métrique un couple (X, bo), 
constitué d’un ensemble (espace) X d'éléments (points) et d’une distance 
(métrique) p, c’est-à-dire une fonction réelle non négative p (x, y}, 
définie pour tous les x, y € X et satisfaisant aux trois axiomes sui- 
vanis : 

1) p (x, y) = 0 si et seulement si x = y, 

2) (axiome de symétrie): p (x, y) = p (y, x), 

3) (inégalité triangulaire) : p (x, z) < p (x, y) + p (y, 2). 

Nous désignerons généralement l’espace métrique lui-même, 
c'est-à-dire le couple (X, p), par une seule lettre: 


R — (X, p). 


S'il n’y a aucune confusion à craindre, nous désignerons souvent 
l’espace métrique par le même symbole que l’ensemble de ses 
points À. 

Considérons des exemples d'espaces métriques. Certains de ces 
espaces jouent un rôle important en analyse. 

1. En posant pour les éléments d’un ensemble arbitraire 


Ô, si x — y, 
p (x, y)= 1, si x Æ y, 


on obtient évidemment un espace métrique. Get espace pourrait être 
appelé espace de points isolés. 
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2. L'ensemble des nombres réels, muni de la distance 
p (x, y) = | x — y |, 


est un espace métrique, noté R! 
3. L'ensemble des systèmes ordonnés de x nombres réels 


ZX = (ty, Los + +. Ln); 


muni de la distance 
p (x, y)= V > Gr— a), (1) 


est appelé espace arithmétique euclidien à n dimensions et noté R”. 
Les axiomes 1) et 2) dans R” sont évidents. Montrons que dans R” 
l'inégalité triangulaire est aussi vérifiée. 

Soient x = (ty, . - ., Zn), y — (Ya, . . +, Yn) et 2 = (24, . .., Zn); 
alors l'inégalité triangulaire peut s’écrire sous la forme : 


V > en < > Ga + 1 > (zx — y). (2) 
k=1 k=—1 k—1 


En posant y} — Zp — Gp, Zn — Yr —= bp, on obtient 2, — x; — 
— An + db, et l'inégalité (2) devient alors: 


V > a+} a+ À D. (3) 
k=—1 R—1 k=1 


Or, cette inégalité est une conséquence immédiate de l'inégalité 
bien connue de Cauchy-Bouniakovsky 1): 


(D ab) D ai. > bd. (4) 
k=—1 Rk=1 k—1 


En effet, d’après cette inégalité on a 


2 (a+b}e D +2 2 abat D 'EÈ< D ai + 
RON n n n 2 
12 à. Su + Du = 2 a + Su). 
R=1  k=1 k=1 R=1 k=1 
d’où l'inégalité (3) et donc l'inégalité (2). 


1) L'inégalité de Canony-Bouniakoysky découle de l'identité 


ñn 9 n n 

(Da) = > S'æ . DES (au 
R=1 RkR=1 i=1 J—1 

qui peut être vérifiée immédiatement. 
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4. Considérons de nouveau l’ensemble des systèmes ordonnés 


de r nombres réels x = (x, . . ., x,) et définissons la distance entre 
ses éléments, cette fois, par la formule 
ñn 
pi( = 2 |æa—vl: (5) 


Les axiomes 1)-3) sont évidents. On désigne l’espace métrique obtenu 


par le symbole R'. 
o. Considérons le même ensemble que dans les exemples 3 et 4 et 


définissons une distance entre ses éléments par la formule 
Po(xr, y) = max |ys —xx |. (6) 
1SR< 

Les axiomes 1)-3) sont évidents. On désigne cet espace métrique 
par Ri; dans beaucoup de questions d’analyse il est aussi commode 
que l’espace euclidien R”. 

Les trois derniers exemples montrent qu'il importe parfois de 
noter différemment un espace métrique et l’ensemble de ses points, 
car le même ensemble peut être métrisé de différentes façons. 

6. L'ensemble C la, b] de toutes les fonctions réelles continues, 
définies sur le segment [a, b], muni de la distance 


p (f, 8) = Dax Le (t)—f()1, (7) 


est aussi un espace métrique. Les axiomes 1)-3) sont vérifiés immédia- 
tement. Cet espace joue un rôle très important en analyse. Nous 
allons le désigner par le même symbole C fa, b] que l’ensemble des 
points de cet espace. Au lieu de C [0, 1] nous écrirons simplement C. 

7. Désignons par /, l’espace métrique dont les points sont les 
suites de nombres réels 


Z = (4, Los © + +) Ens + +), 


telles que 


O0 
>» TE ©, 


R=1 


et dont la distance est définie par la formule 


@D= y Ë Gien Û 


De l'inégalité évidente 
(re + y) 2 (28 + yh) 
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il résulte que la fonction p (x, y) est définie pour tous les x, y € b, 


c'est-à-dire que la série >, (yx — x#)? est convergente, si 
k=1 


Da < oo et D y < oo. 

k=1 k=—1 

Montrons maintenant que la fonction (8) vérifie les axiomes de l’espa- 
ce métrique. Les axiomes 1) et 2) sont évidents ; l’inégalité triangu- 
laire s’écrit : 


V > (za — 2) V Di (za — y) + V D (yn—zn}. (9) 
k=—=1 R—=1 k=1 


D'après ce qui précède, chacune des trois séries écrites ici est conver- 
gente. D'autre part, pour chaque n on a l'inégalité 


V > ane) D (2x — ya) + V > (yr — zx) 
k=—1 R—1 R=1 


(cf. exemple 4). En passant dans cette inégalité à la limite pour 
n — oo, on obtient (9), c’est-à-dire l'inégalité triangulaire dans l. 

8. Considérons, comme dans l'exemple 6, l’ensemble des fonc- 
tions définies et continues sur le segment [a, b], mais en définissant 
cette fois la distance par la formule 


b 


1/2 
Pa n= (| GO-vy a)". (10) 
a 
Un tel espace métrique sera noté C? la, b] et nommé espace des 
fonctions continues à métrique quadratique. Les axiomes 1) et 2) de 
l'espace métrique sont cette fois encore évidents ; l'inégalité trian- 


gulaire découle de l’inégalité de Cauchy-Bouniakovsky sous forme 
intégrale !) 


b bd d 
({ c(y@a) < | 22 (4) dé. | y? (9) de. 


9. Considérons l’ensemble des suites bornées de nombres réels 
Z = (ti, La, - + +, Xn, . . .). En posant 


p (x, y) —sup| y — 2} |, (11) 


.__ }) Cette inégalité peut être obtenue, par exemple, de l'identité facile 
à vérifier suivante: 


b b b 


(| x (t) y (6) a)" | x2 (4) dt | roa{ | [x (s) y (t) —y (s) x (4)1? ds dt. 


(o | a 
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on obtient un espace métrique, que nous désignerons par m. Les 
axiomes 1)-3) sont évidents. 
10. L'ensemble des systèmes ordonnés de x nombres réels, muni 


de la distance 
pp Ge y) = (2 lux PJ, (12) 


où p est un nombre quelconque > 1, est un espace métrique, que nous 
désignerons par KR. Les axiomes 1) et 2) sont dans ce cas encore 
évidents. Vérifions l’axiome 3). Soient 


TD (ty, ..., Tn)s Y = (Ya + + +, Un), 2 = (21, . . ., 2) 
trois points de R7. Posons 
Ur — Th = ps Zn — Yr = Ur; 
alors l'inégalité 
Pp (&, 2) < Pp (x; y) + Pp (y, 2), 
que nous devons établir, prend la forme suivante : 


C2, jan + b [PJ P< C2, | ax P)P+ C2] ba[P)"P. (13) 


C’est l'inégalité de Minkowski. Pour p = 1 elle est évidente (le modu- 
le de la somme est inférieur ou égal à la somme des modules), c’est 
pourquoi nous allons considérer p > 1 !). 

La démonstration de l'inégalité (13) pour p > 1 est basée sur 
l'inégalité de Hôlder : 


n n n 
2 [abs | (2 | a; [P)*/? (2 A0 ne (14} 


où les nombres p >> 1 et q > 1 sont liés par la relation 


| 1 
tai où q= DT: (15} 


Remarquons que l'inégalité (14) est homogène. Cela signifie que: 
si elle est vérifiée pour deux vecteurs 


a — (ay, ..., an) et b — (b:, . .., b), 


elle l’est aussi pour les vecteurs Àa et ub, où À et u sont des nombres 
arbitraires. C’est pourquoi il suffit de démontrer l'inégalité (14) 


1) Pour p << 1 l'inégalité de Minkowski n’a pas lieu. Autrement dit, si 


l’on voulait considérer l’espace R? pour p << 1, dans un tel espace l'inégalité: 
triangulaire ne serait pas vérifiée. 
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pour le cas où 
n n 
D JafP= ZI f=t. (16) 
k=1 k=1 
Supposons donc que la condition (16) soit remplie et démontrons 
que 
2 | axbx | & 1. (17) 


Considérons sur le plan (£, n) la courbe définie par l'équation 
n = £P-1 (£ > 0) ou, ce qui revient au même, par l'équation £ — 


7 
ô 
a 
Fig. 7 


— N°71 (fig. 7). D’après la figure il est clair que pour toutes valeurs 
positives de aet bon a S, + S, > ab. Calculons les aires S, et S:: 


a 
SET, s= fursan 
0 
Ainsi, on a l'inégalité numérique 
a? bq 
ab << D LE . 


En remplaçant dans cette inégalité a par | a, | et b par |b, | 
et en sommant sur k de À à n, on obtient, compte tenu de (15) et (16), 


> lab |<1, 
k—1 


c'est-à-dire l'inégalité (17). Par conséquent, l'inégalité générale (14) 
est aussi démontrée. Si dans l’inégalité de Hôlder (14) on met p — 2, 
on retrouve l'inégalité de Cauchy-Bouniakovsky (4). 

Passons maintenant à la démonstration de l'inégalité de Min- 
kowski. Pour cela, considérons l'identité 


(al+1b)=({al+ 18) Tal+(al+ 1e Tel. 
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En remplaçant ici a par a,, b par b; et en sommant sur # de À à n, 
on obtient 


2 Qal+lè = 2 (al+lb alt 2 (ai HT DT be le 


R=— 


En appliquant maintenant l'inégalité de Hôlder à chacune des 
deux sommes du second membre el en tenant compte du fait que 
(p — 1) q = p, on obtient 


À Garl+ be DCS (anl+ on DP) (LS Ja PI + 
En divisant les deux membres de cette inégalilé par 
CS Cex1+-1bn pr)" 
il vient 
où (Lan | + 1b Dr) < (È [ar [PP + (> Lox1P), 


d'où l’on déduit immédiatement l'inégalité (13). Ainsi donc, on 
a établi l'inégalité triangulaire dans l’espace KR. 

La métrique p,, considérée dans cet exemple, coïncide avec la 
métrique euclidienne (cf. exemple 3) pour p — 2 et avec la métrique 
de l’exemple 4 pour p = 1. On peut montrer que la métrique 


Po(x, y)—= max |yr —x;| 
1<h< 


SAN 


de l’exemple 5 est le cas limite de la métrique p, (x, y), c’est-à-dire 
n 
Po(æ, y)= lim (2 [ya — a |?) 
DP—+oo hk—1 
De l'inégalité 
a? ba A 1 
DE + (stat): 


établie plus haut, on déduit sans peine l'inégalité intégrale de Hôlder : 


b b b 
frovolaes(|i:oPa)?([irore)" 


vraie pour toutes les fonctions x (t) et y (t), telles que les intégrales 
du second membre existent. De là on obtient à son tour l'inégalité 


$ 1] NOTION D'ESPACE MÉTRIQUE 49 


intégrale de Minkowski : 


b b b 
1/p | 1/p 1/P 
(liro+vopPa) "<(|irOPa&) "+ (Ir Pæ) 
a a a 

11. Examinons encore un exemple important d'espace métrique. 
Ses éléments sont les suites de nombres réels 

L = (Xy, Lo, +. Em + +), 

lelles que 


OO 
N 
2 tn? oo, 
R=1 
où p > À est un nombre fixe ; la distance étant définie par la formule 


pa, = (2 una PP}. (18) 


Cet espace métrique sera désigné par l;. 
En vertu de l'inégalité de Minkowski (13), pour tout n on a 


n n n 
(2 | Jr TR P)r< C2 | x, [?) "7? + C2: | Ur jP)"?. 


Comme, par hypothèse, les séries 


O0 


O0 
2 [al et 2 |yxl? 
k=1 k=—1 
sont convergentes, en passant à la limite pour 7 — œ, on obtient 


(D ur — an PPT ax P)P + CT Jun) Po. (19) 
k=—1 k=—1 R=1 

Ainsi, nous avons démontré que la distance, définie dans L, par la 
formule (18), existe effectivement, quels que soient x, y € L,. L'’iné- 
galité (19) montre aussi que dans /, l’inégalité triangulaire est véri- 
fiée. Les autres axiomes sont évidents. 

On obtiendra une infinité d’autres exemples par le procédé sui- 
vant. Soient R — (X, p) un espace métrique et M un sous-ensemble 
quelconque de X. Alors le couple formé par l’ensemble 7 et la même 
fonction p (x, y), qui est maintenant supposée définie pour x, y € M, 
est aussi un espace métrique; on l'appelle sous-espace de l’espace 
métrique À. 

2. Applications continues d’un espace métrique dans un autre. 
Isométrie. Soient X et Ÿ deux espaces métriques et f une applica- 
tion de X dans Y. Cela signifie qu’à tout x € X on fait correspondre 
un élément y = f (x) de Y. L'application f est appelée continue au 
4—0167 
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point xo € À, si pour tout nombre € >> 0 il existe un nombre ô > 0, 
tel que pour tous les x € X vérifiant la condition 


p (x, To) < Ô 
on a l'inégalité 
Pi (x), f (xo)) < € 


(ici o désigne la distance sur X et p; la distance sur Y). Si l’applica- 
tion jf est continue en tout point de l’espace X, on dit que f est conti- 
nue sur X. Si X et Y sont des ensembles numériques, c’est-à-dire si f 
est une fonction numérique, définie sur un sous-ensemble X de la 
droite numérique, la définition ci-dessus coïncide avec la définition, 
bien connue en analyse élémentaire, de la continuité d’une fonction. 

On peut définir de manière analogue la continuité d’une fonction 
(application) f de plusieurs variables x, € X,, ..., x, € X, (où 
X:, -.., X, sont des espaces métriques) à valeurs dans un espace 
métrique Ÿ. 

Remarquons, à cette occasion, que la distance p (x, y), considérée 
comme une fonction de deux variables x et y de X, est elle-même 
continue. Cela résulte immédiatement de l'inégalité 


Le (x, y) — p (to, yo) | < p (to Z) + P (Yo: y); 


que l’on peut déduire facilement de l'inégalité triangulaire. 

Si l’application f : X — Y est biunivoque, il existe une applica- 
tion réciproque zæ = f"! (y) de l’espace Y sur l’espace X. Si l’applica- 
tion f est biunivoque et bicontinue (c’est-à-dire f et f-! sont conli- 
nues), elle est appelée application homéomorphe ou homéomorphisme ; 
les espaces X et Y, entre lesquels on peut établir un homéomorphis- 
me, sont dits homéomorphes. Comme exemple d'espaces métriques 
homéomorphes on peut indiquer la droite numérique (—co, æ) et 
un intervalle quelconque, par exemple, l'intervalle (—1, 1). Dans 
ce cas, l’homéomorphisme est défini par la formule 


2 
y=— arcig x. 


Un cas particulier important de l’homéomorphisme est l’application 
dite isométrique. 

On dit que la bijection f entre les espaces métriques R = (X, p) 
et R° = (Y, p’) est une isométrie, si 


P (z3; Te) = p" ( (xs; f (x2)). 


quels que soient x, t2 € R. Les espaces R et R”, entre lesquels on 
peut établir une application isométrique, sont dits isométriques. 

L'isométrie des espaces À et R” signifie que les relations métriques 
entre leurs éléments sont les mêmes; seule la nature de leurs élé- 
ments peut être différente, mais cela est sans importance du point 
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de vue de la théorie des espaces métriques. Par la suite, les espaces 
isométriques seront considérés comme identiques. 

Nous reviendrons sur les notions abordées ici (continuité, homéo- 
morphisme), d’un point de vue plus général, à la fin du $ 5 de ce 
chapitre. 


$ 2. Convergence. Ensembles ouverts 
et ensembles fermés 


1. Points d’accumulation. Fermeture. Nous introduirons ici 
quelques notions de la théorie des espaces métriques qui seront. 
souvent utilisées dans la suite. 

On appelle boule ouverte B (xs, r) d’un espace métrique R l’en- 
semble des points x € R tels que 


ep (x, Xo) LT. 


Le point x, est le centre de cette boule, le nombre r est son rayon. 
On appelle boule fermée B {xo, rl l’ensemble des points x € R 
tels que 


p (x, Lo) LT. 


La boule ouverte de centre x, et de rayon e est appelée encore 
e-voisinage du point x, et notée par le symbole O, (x). 


Exercice. Donner un exemple d'espace métrique contenant deux boules 
B (x, p1) et B (y, p2) telles que p4 > p2 et pourtant B (x, ps) CB (y, Po). 


Un point x € R est appelé point adhérent à l’ensemble M € R, 
si tout voisinage de x contient au moins un point de MW. L'ensemble 
de tous les points adhérents à l’ensemble M s'appelle fermeture de M 
et se note [A7]. Ainsi, nous avons défini sur les ensembles d’un espace 
métrique l'opération de fermeture qui consiste dans le passage d’un 
ensemble M à sa fermeture [M1]. 


Théorème 1. L'opération de fermeture possède les propriétés 
suivantes : 

1) M € [MI, 

2) [MI] = [W1, 

3) si M, € M», alors [M,] € [Ml], 

4) [AZ, U M] — [17,1 U [AZ 1. 


Démonstration. La première propriété est évidente, car 
tout point appartenant à M est un point adhérent à M. Démontrons 
la deuxième. 

Soit x un point de [MI]. Alors, tout voisinage O, (x) de ce point 
contient un point x; € [M]. Posons € — p (x, x;) — €, et considérons 
la boule O:, (x1). Cette boule est contenue toute entière dans O, (x). 


4% 
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En effet, si z € O4 (x), alors p (2, x) << € et comme po (x, x;) = 
— £ — &;,, d'après l'inégalité triangulaire on a 


p (z, x) 'Ey + (E — &) = Ee, 


c'est-à-dire z € O, (x). Puisque x; € [M], on trouvera dans O,, (x) 
un point z2 € M. Mais alors x € O, (x). Etant donné que O, (x) 
est un voisinage arbitraire de x, on a donc x E [MI]. La deuxième 
propriété est démontrée. 
La troisième propriété est évidente. Démontrons la quatrième. 
Si x EM, U Mi}, alors x appartient au moins à l’un des ensem- 
bles [47,1 et [M2], c'est-à-dire 


[AZ, U M] CC [AZ,] U [AZ]. 


Etant donné que M, € M, U M et M € M, U M, l'inclusion 
réciproque résulte de la propriété 3). 

Le théorème est complètement démontré. 

Un point x € R est appelé point d’accumulation de l’ensemble 
M € R, si tout voisinage de x contient une infinité de points de A. 

Un point d'accumulation de l’ensemble M peut être dans A7 
ou ne pas y être. Par exemple, si M est l’ensemble des nombres ra- 
tionnels du segment [0, 1}, tout point de ce segment est un point 
d’accumulation de M. 

Un pointz appartenant à l’ensemble M est appelé point 
isolé de cet ensemble, s’il existe un voisinage O, (x) de x ne contenant 
aucun point de 7, autre que x. On propose au lecteur, à titre d’exer- 
cice, de démontrer la proposition suivante: 

Tout point adhérent à l’ensemble M est soit un point d’accumula- 
tion, soit un point isolé de cet ensemble. 

On peut en conclure que la fermeture [M1] est constituée par des 
points de trois sortes : 

1) points isolés de l’ensemble W ; 

2) points d’accumulation de M, appartenant à M; 

3) points d’accumulation de M, n'appartenant pas à M. 

Donc, la fermeture [A] d'un ensemble M s'obtient par adjonc- 
tion à M de tous ses points d’accumulation. 

2. Convergence. Soit x, 22, . .. une suite de points de l’espace 
métrique À. On dit que cette suite converge vers x, si tout voisinage 
O, (x) du point x contient tous les points x, à partir d’un certain 
rang, autrement dit, si pour tout nombre € >> 0 on peut trouver 
un nombre W , tel que O, (x) contienne tous les points x, avec n > 
> N.. Le point x est appelé limite de la suite {x, }. 

Cette définition peut être, évidemment, formulée encore de la 
manière suivante: la suite {x,} converge vers x, si 


lim p(x, Zn) = 0. 


NN — 00 


$ 2] CONVERGENCE. ENSEMBLES OUVERTS ET FERMÉS 53 


De la définition il résulte immédiatement que 1) aucune suite ne 
peut avoir deux limites différentes et que 2) si la suite {x,} converge 
vers x, toute sous-suite de {x,} converge vers le même point x. 

Le théorème suivant établit un lien étroit entre la notion de point 
adhérent et celle de limite. 


Théorème 2. Pour qu'un point x soit adhérent à l'ensemble 
M, il faut et il suffit qu'il existe une suite {x,} de points de M, ad- 
mettant x pour limite. 


Démonstration. La condition est nécessaire, car si x 
est un point adhérent à l’ensemble M, tout voisinage Oinx de x 
contient au moins un point x, € M. Ces points forment une suite 
qui converge vers x. Il est évident que la condition est aussi suffi- 
san(e. 

Si x est un point d’accumulation de MW, les points x, € Oin (x) 
NM M correspondant à des n différents peuvent être choisis deux 
à deux distincts. Donc, pour que x soit un point d'accumulation de 
l’ensemble M, il faut et il suffit qu'il existe dans M une suite de points 
deux à deux distincts, admettant x pour limite. 

La notion de continuité de l’application d’un espace métrique X 
dans un espace métrique Ÿ , introduite au $ 1, peut être maintenant 
exprimée en termes de convergence des suites. À savoir, l’application 
y = f (x) est continue au point xo, si pour toute suite {x,} qui con- 
verge vers xo la suite {y, — f (x,)} converge vers yo = f (to). La 
démonstration de l’équivalence de cette définition à celle du $ 1 
ne diffère en rien de la démonstration de l’équivalence des deux 
définitions analogues (« en termes de &, Ô » et « en termes de suites ») 
de la continuité des fonctions numériques et peut être laissée au 
lecteur. 

3. Sous-ensembles denses. Soient À et B deux ensembles 
d’un espace métrique À. L'ensemble À est dit dense dans B, si [A] = 
D B. En particulier, l’ensemble À est dit partout dense (dans 
l’espace R), si sa fermeture [A] coïncide avec l’espace R tout entier. 
Par exemple, l’ensemble des nombres rationnels est partout dense 
sur la droite numérique. L’ensemble À est dit nulle part dense , 
s’il n’est dense dans aucune boule, c’est-à-dire si toute boule BC R 
contient une autre boule B” n'ayant avec À aucun point commun. 

Exemples d'espaces contenant un ense m- 
ble partout dense et dénombrable. Tout espace 
métrique, qui contient un ensemble partout dense et dénombrable, 
est dit séparable. Etudions de ce point de vue les exemples donnés 
au $ 1. 

1. L'espace « discret », défini dans l’exemple 1, $ 1, contient un 
ensemble partout dense et dénombrable si et seulement si cet espace 
est lui-même un ensemble dénombrable. C’est que la fermeture [HW] 
de tout ensemble M de cet espace coïncide avec M. 
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Tous les espaces énumérés dans les exemples 2-8, $ 1, contiennent 
des ensembles partout denses et dénombrables. Indiquons dans cha- 
cun d'eux un tel ensemble, en conseillant instamment au lecteur 
d'effectuer en détail toutes les démonstrations. 

2. Sur la droite numérique R!: les points rationnels. 

3-0. Dans l’espace euclidien à x dimensions R' et dans les espaces 
R?, Rÿ : l’ensemble des vecteurs à coordonnées rationnelles. 

6. Dans l’espace C [a, b]l: l’ensemble des polynômes à coeffi- 
cients rationnels. 

7. Dans l’espace /,: l’ensemble des suites à termes rationnels 
dont chacune ne contient qu’un nombre fini de termes non nuls (ce 
nombre étant, en général, différent pour des suites différentes). 

8. Dans l’espace C°? [a, bl: l’ensemble des polynômes à coeffi- 
cients rationnels. 

Par ailleurs, l’espace des suites bornées m (exemple 9, $ 1) n’est pas 
séparable. 

En effet, considérons toutes les suites possibles ayant pour ter- 
mes 0 et 1. Elles forment un ensemble qui a la puissance du continu 
{parce qu’il est possible d'établir une correspondance biunivoque 
entre ces suites et les sous-ensembles de la suite naturelle). La dis- 
tance de deux points de cette espèce, définie par la formule (11), $ 1, 
est égale à 1. Entourons chacun de ces points d’une boule ouverte de 
rayon 1/2. Ces boules seront disjointes. Si un ensemble est partout 
dense dans m, chacune des boules construites doit contenir au moins 
un point de cet ensemble ; par conséquent, un tel ensemble ne peut 
pas être dénombrable. 

4, Ensembles ouverts et ensembles fermés. Considérons les types 
d’ensembles les plus importants d’un espace métrique, à savoir les 
ensembles ouverts et les ensembles fermés. 

Un ensemble M de l’espace métrique R est appelé ensemble fermé, 
s’il coïncide avec sa fermeture : [M] — M. Autrement dit, un en- 
semble est fermé, s’il contient tous ses points d’accumulation. 

En vertu du théorème 1, la fermeture de tout ensemble est un 
ensemble fermé. Il suit du même théorème que [M] est le plus petit 
des ensembles fermés contenant M. (Démontrer!) 

Exemples. 1. Tout segment [a, b] de la droite numérique 
est un ensemble fermé. 

2. Toute boule fermée est un ensemble fermé. En particulier, 
l’ensemble des fonctions f de l’espace C [a, b], telles que | f () | < X, 
est un ensemble fermé. 

3. L'ensemble des fonctions f de C [a, b], telles que | f (t) | << K 
(boule ouverte), n’est pas fermé; sa fermeture est l’ensemble des 
fonctions qui vérifient la condition |f (4) | < X. 

4. Quel que soit l’espace métrique R, l’ensemble vide @ et 
l’ensemble À lui-même sont fermés. 

9. Tout ensemble formé d’un nombre fini de points est fermé. 
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Les propriétés fondamentales des ensembles fermés sont exprimées 
par le théorème suivant. 


Théorème 3. T'oute intersection et toute réunion finie d’en- 
sembles fermés sont des ensembles fermés. 


Démonstration. Soit F — | F, une intersection d’en- 
sembles fermés F, et soit x un point d’accumulation de F. Cela signi- 
fie que tout voisinage ©, (x) de x contient une infinité de points de F. 
Mais alors, O, (x) contient, à plus forte raison, un nombre infini 
de points de chaque ensemble F, et, comme tous les ensembles F, 
sont fermés, le point x appartient à chaque F,; par conséquent, 
zEF—/f(NF,, c'est-à-dire F est fermé. 

Soit maintenant F la réunion d’un nombre fini d’ensembles 


n 
fermés: F = |) F; et soit x un? point n’appartenant pas à F. Mon- 
i=1 
trons que x ne peut pas être un point d’accumulation de F. En effet, 
x n'appartient à aucun des ensembles fermés F;; donc, il n’est point 
d'accumulation d’aucun de ces ensembles. Par suite, pour chaque à 
il existe un voisinage O4, (x) du point x qui contient au plus un nom- 


bre fini de points de F;. En prenant le plus petit des voisinages 
On (x), - - ., Oen (x), on obtiendra un voisinage O, (x) du point x, 
contenant au plus un nombre fini de points de F. 

Ainsi donc, si un point x n'appartient pas à F', il ne peut pas être 
point d’accumulation de F, c’est-à-dire F est un ensemble fermé. 
Le théorème est démontré. 

On dit que x est un point intérieur à l’ensemble M, s’il existe un 
voisinage 0. (x) de ce point tel que O. (x) € M. 

L'ensemble dont tous les points sont intérieurs est appelé en- 
semble ouvert. 

Exemples. 6. Tout intervalle (a, b) de la droite numérique 
R! est un ensemble ouvert. En effet, si a à << b, le voisinage 
O,(x) de «, où e — min (x — a, b — «), est contenu tout entier 
dans l'intervalle (a, b). 

7. Dans tout espace métrique À une boule ouverte B (a, r) est un 
ensemble ouvert. En effet, si x € B (a, r), on a p (a, x)  r. Posons 
e —=r—pl(a,x). Alors, B (x, &) CB (a, r). 

8. L'ensemble des fonctions continues sur le segment Îa, bl 
telles que f ({)  g (t), où g (£) est une fonction continue fixée quel- 
conque, est un sous-ensemble ouvert de l’espace C [a, bl. 


Théorème 4. Pour qu'un ensemble M soit ouvert, il faut 
et il suffit que son complémentaire RKM soit fermé. 


Démonstration. Si l’ensemble M est ouvert, tout point 
x € M possède un voisinage contenu dans M, c’est-à-dire n'ayant 
aucun point commun avec RÀRK M. Donc, aucun point n’appartenant 
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pas à RXM ne peut être adhérent à R\X M, ce qui signifie que RM 
est fermé. Inversement, si RKM est fermé, tout point de A7 possède 
un voisinage inclus dans M, c’est-à-dire AZ est ouvert. 

Etant donné que l’ensemble vide et tout l’espace RÀ sont des 
ensembles fermés et en même temps chacun d’eux est le complémen- 
taire de l’autre, on conclut que l’ensemble vide et l'espace R sont des 
ensembles ouverts. 

Du théorème 3 et du principe de dualité (l’intersection des com- 
plémentaires est égale au complémentaire de la réunion, la réunion 
des complémentaires est égale au complémentaire de l'intersection, 
(cf. pages 9-10) on déduit le théorème important suivant, dual du 
théorème 3. 


Théorème 3’. Toute réunion (finie ou infinie) et toute inter- 
section finie d’'ensembles ouverts sont des ensembles ouverts. 


Les ensembles appartenant à la o-algèbre minimale engendrée 
par tous les ensembles ouverts et fermés s'appellent ensembles boré- 
liens. 

9. Ensembles ouverts et fermés sur la droite. La structure des 
ensembles ouverts et fermés d’un espace métrique peut être très 
compliquée. Cela concerne même les ensembles ouverts et 
fermés d’un espace euclidien à deux ou plusieurs dimensions. Cepen- 
dant, dans le cas d’une seule dimension, c’est-à-dire dans le cas de la 
droite, une description exhaustive de tous les ensembles ouverts 
(et donc de tous les ensembles fermés) ne présente pas de difficultés. 
Elle est donnée par le théorème suivant. 


Théorème 5. Tout ensemble ouvert de la droite numérique 
est une réunion finie ou dénombrable d’intervalles deux à deux disjoints". 


Démonstration. Soit G un ensemble ouvert de la droite 
numérique. Introduisons dans G une relation d'équivalence, en po- 
sant x — y, s’il existe un intervalle (œ, $) tel que x, y E (&, f) = G. 
Il est évident que cette relation est réflexive et symétrique ; elle est 
aussi transitive, car si x — y et y — z, il y a deux intervalles («, B) 
et (y, Ô) tels que 

T, y € (a, B) € G et VE z € (y, 0) € G. 
Mais alors y << B, l'intervalle (x, à) est inclus dans G et contient les 


points x et z. Par conséquent, l’ensemble G se trouve partagé en clas- 
ses disjointes 7, des points équivalents entre eux: 


G=Ù J.. 


Démontrons que chaque 7, est un intervalle (a, b), où a = ini J,, 
b = sup Z.. L’'inclusion 7, € (a, b) est évidente. D'autre part, si 


1) Les ensembles de la forme (—c co), (œ, ) et (—0o, f) sont aussi con- 
sidérés comme des intervalles. 
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x, y ET,, par la définition même de 7, on a (x, y) & 14. À toute pro- 
ximité de a à droite et à toute proximité de b à gauche il existe des 
points de Z,. Donc, 7, contient tout intervalle (a’, b') dont les extré- 
mités appartiennent à (a, b), d’où 7, — (a, b). La famille d'’inter- 
valles disjoints 7, ainsi obtenus est finie ou dénombrable ; en effet, 
en choisissant arbitrairement dans chacun de ces intervalles un 
point rationnel, on établira une correspondance biunivoque entre 
l’ensemble de ces intervalles et une 


partie de l’ensemble des nombres 0 y 
rationnels. ——_————— PF, 
Le théorème cest démontré. 0 14 Z ’ 

Comme tout ensemble fermé est —— — PF, 

le compémentaire dur ensembie 0 V3 7, 1, 
ouvert, on en déduit que tout ensem- — >— 5, 77 

À % % n% *À 


ble fermé de la droite numérique 


peut être obtenu, en retirant de la —— —— TT = !3 
droite numérique un nombre fini E 
ou une infinité dénombrable d’inter- 77 7 TT 74 


valles. 

Comme exemples élémentaires 
d'ensembles fermés de la droite 
numérique on peut citer les segments, les points isolés et les réunions 
de tels ensembles pris en nombre fini. Un exemple plus compliqué 
d'ensemble fermé de la droite numérique est fourni par l’ensemble 
triadique de Cantor que nous nous proposons de considérer ici. 

Soit F, le segment [0, 1]. Supprimons l'intervalle (1/3, 2/3) et 
désignons l’ensemble fermé qui reste par F,. Ensuite, supprimons les 
intervalles (1/9, 2/9) et (7/9, 8/9) et désignons l’ensemble fermé qui 
reste (comportant quatre segments) par F,. Dans chacun de ces quatre 
segments supprimons l'intervalle médian de longueur (1/3)°, etc., 
(fig. 8). En répétant ce procédé, on obtient une suite décroissante 
d’ensembles fermés F,. Posons 


E — N Fh. 
n=0 
F est un ensemble fermé (comme intersection d’ensembles fermés). 
Il est obtenu du segment [0, 1] par suppression d’une famille dé- 


nombrable d’intervalles. 
Etudions la structure de l’ensemble F. Il contient, évidemment, 


les points 


Fig. 8 


1 2 2 7 8 
0, +, 3 gr go: gg: (1} 
c'est-à-dire les extrémités des intervalles supprimés. Mais ces points 
n’épuisent pas l’ensemble F. En effet, les points du segment [0, 11 
qui appartiennent à l’ensemble F peuvent être caractérisés de la 
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manière suivante. Ecrivons chacun des nombres x, 0 £ x < 1 dans 
Je système de base 3 : 
a 


1, 2 Un 
T=— F3 Te. Tan — 


où les nombres a, peuvent prendre les valeurs 0, 1 et 2. Tout comme 
dans le cas des développements décimaux, certains nombres admettent 
deux représentations différentes. Par exemple, 


1 1 0 0 0 2 2 
= tte tast. = ++... ++... 


On vérifie aisément que l’ensemble F contient les points x, 0 < 
< x 1, et ceux-là seulement, qui admettent au moins un dévelop- 
pement triadique tel que la suite a, &o, . . ., &n, . . . ne contienne 
pas le chiffre 1. Donc, à tout point x € F on peut faire correspondre 
une suite 


y, Any ce Ans... (2) 


avec a, égal à 0 ou à 2. L'ensemble de ces suites a la puissance du 
continu. Pour s’en convaincre il suffit de faire correspondre à chaque 
suite (2) une suite 


bi, Do, ..., bn, ... (2’) 


avec b, = 0 pour a, — 0 et b, — 1 pour a, — 2. La suite (2”) peut 
être considérée comme le développement dyadique d’un nombre réel 
y, 0 L y L'1. On obtient ainsi une application de l’ensemble F sur 
le segment [0, 1]. On en conclut que F a la puissance du continu 1). 
Puisque l’ensemble des points (1) est dénombrable, ces points ne 
peuvent pas épuiser tout l’ensemble F. 


. x . À _ Lab 
Exercices. 1. Démontrer directement que le point 7 appartient à l’en- 


semble F sans toutefois être l’extrémité d’un intervalle que l’on supprime. 
1 
4 
dans le même rapport 1:38 aussi le segment [0, 1/3] qui reste après la première 
suppression, etc. 

Les points (1) sont appelés points de première espèce de l’ensemble F, les 
autres points de F étant appelés points de seconde espèce. 

2. Démontrer que les points de première espèce forment un ensemble partout 
dense dans 7. 

3. Montrer que les nombres de la forme ti + t» avec ty, t2 € F remplissent 
tout le segment [0, 2]. 


Indication. Le point —- divise le segment [0, 1] dans le rapport 1 :3. Il divise 


1) La correspondance établie entre F et le segment [0, 1] est univoque, mais 
pas biunivoque (car certains nombres peuvent être représentés par deux dévelop- 
pements diftérents). On en déduit que F a au moins la puissance du continu. 
Mais F est une partie du segment [0, 1], donc sa puissance ne peut pas être supé- 
rieure à celle du continu. 


$ 2] CONVERGENCE. ENSEMBLES OUVERTS ET FERMÉS 59 


Nous avons montré que l’ensemble F a la puissance du continu ; 
c’est-à-dire qu'il contient autant de points que le segment [0, 1] 
tout entier. 

Il est intéressant de comparer ce fait au résultat suivant: la 


somme des longueurs _ + £ + s + ... des intervalles suppri- 
més fait exactement 1! 


Remarques complémentaires | 
(1) Soient M un ensemble quelconque de l’espace métrique À et x un point 
de cet espace. On appelle distance du point x à l’ensemble M le nombre 


p(xr, M)— inf p(x, a). 
ac M 


Siz € M,onap (x, M) = 0, mais du fait que p (x, M) = 0 il ne résulte pas 
que z € M. De la définition du point adhérent on déduit immédiatement que 
? (x, M) = 0 si et seulement si x est un point adhérent à l’ensemble M. 

Ainsi donc, l’opération de fermeture peut être définie comme l’adjonction 
à l’ensemble donné de tous les points dont la distance à cet ensemble est nulle. 

(2) On définit de façon analogue la distance de deux ensembles. À et B 
étant deux ensembles de l’esepace métrique R, on pose 


op (4, B)=infp (a, b). 
ac A 
bCB 


SiA(B-Zg,on ap(4, B) = 0; la réciproque n’est pas, en général, vraie. 
(3) Soit MK l’ensemble de toutes les fonctions f de l’espace C [a, b], vérifiant 
la condition de Lipschitz: quels que soient ti, t2 Ella, b], 


[f (4) —f()I<K li -ül|, 


où X est une constante. L'ensemble MK est fermé. Il coïncide avec la fermeture de 
l’ensemble des fonctions dérivables sur [a, b] et telles que | f’ () | < X. 
(4) L'ensemble M = |] M, de toutes les fonctions dont chacune vérifie la 
K 


condition de Lipschitz pour un certain X n’est pas fermé. Sa fermeture coïncide 
avec l’espace C' [a, b] tout entier. 

(5) Un ensemble ouvert G de l’espace euclidien à nr dimensions est appelé 
ensemble connexe, si n'importe quels deux points x, y € G peuvent être joints par 
une ligne brisée contenue toute entière dans G. Par exemple, l’intérieur du disque 
x? + y? LA est un ensemble connexe. Par contre, la réunion des deux disques 


2 L y LAet (x — 2} + y LA 


n'est pas un ensemble connexe (bien que ces disques aient un point adhérent com- 
mun!). Un sous-ensemble ouvert H de l’ensemble ouvert G s’appelle composante 
connexe de G, s’il est connexe et n’est contenu dans aucun sous-ensemble ouvert 
et connexe (plus grand) de l’ensemble G. Introduisons dans G une relation d’équi- 
valence: z = y, s'il existe un sous-ensemble ouvert et connexe À de G conte- 


nant zx et y: 
T,yCHCG. 


De même que dans le cas de la droite, on vérifie facilement que cette relation 
est transitive; G se décompose donc en classes disjointes: G |] Z. Ces classes sont 
des composantes connexes ouvertes de G. Elles forment un ensemble au plus 
dénombrable. | 

Pour n = 1, c’est-à-dire sur la droite, tout ensemble ouvert et connexe est 
un intervalle (parmi les intervalles on compte aussi les ensembles (— ©, a), 


60 ESPACES MÉTRIQUES ET TOPOLOGIQUES [Ch. II 


(b, co) et (— ©, cæ)). Ainsi, le théorème 5 sur la structure des ensembles ouverts 
de la droite renferme deux affirmations : a) tout ensemble ouvert de la droite est 
une réunion finie ou dénombrable de composantes connexes et b) tout ensemble 
ouvert et connexe de la droite est un intervalle. La première de ces affirmations 
est vraie également pour les ensembles des espaces euclidiens à nr dimensions 
(et admet encore d’autres généralisations), tandis que la seconde ne se rapporte 
qu’à la droite. 


$ 3 Espaces métriques complets 


1. Définition et exemples d’espaces métriques complets. Dès les 
premiers pas dans l'étude de l’analyse mathématique on voit le rôle 
important joué par la propriété de complétude de la droite numéri- 
que, c’est-à-dire par le fait que toute suite de Cauchy de nombres 
réels converge vers un nombre réel. La droite numérique représente 
l’un des plus simples exemples d'espaces métriques dits complets 
dont les propriétés fondamentales seront étudiées dans ce para- 
graphe. 

Une suite {x,} de points d’un espace métrique À est appelée 
suite de Cauchy, si elle vérifie la condition de Cauchy, c.-à-d. si 
pour tout € >> 0 il existe un nombre W, tel que 0 (xx, Zn”) < €, 
quels que soient n' > N.etn"> N.. 

De l'inégalité triangulaire on déduit immédiatement que toute 
suite convergente est une suite de Cauchy. En effet, si {x,} converge 
vers x, alors pour tout & >> 0 on peut trouver un nombre W, tel que 


D (Zn, x) < . pour tous les n > N,. Mais alors 0 (xx, xznr) < 


LP (Enr, &) + Ep (tn, x) Le, quels que soient n' > N,etn"> 
> Ne. 

Définition 1. Si dans unespace métrique À toute suite de 
Cauchy est convergente, on dit que cet espace est complet. 

Exemples. Tous les espaces considérés au $ 1, excepté celui 
de l’exemple 8, sont complets. En effet : 

1. Dans l’espace de points isolés (exemple 1, $ 1) les seules suites 
de Cauchy sont les suites stationnaires, c.-à-d. les suites dont tous les 
termes, à partir d'un certain rang, sont égaux entre eux. Evidem- 
ment, toute suite de cette sorte est convergente ; donc, l’espace en 
question est complet. 

2. La complétude de l’espace euclidien R!, dont les points consti- 
tuent l’ensemble des nombres réels, est connue du cours d'analyse. 

3. La complétude de l’espace euclidien R”, découle immédiate- 
ment de la complétude de R!. En effet, soit {x()} une suite de Cauchy 
de points de R'"; cela signifie que pour tout e >> 0 il existe un 
nombre NV — N, tel que 


n 
> ( x) He roy? < e2 
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pour tous les p et q supérieurs à MN. Ici x —={r, ..., am». 
Donc, pour chaque k — 1, 2, ..., n on a l'inégalité 


| x) — xp) | < e 


quels que soient p, q > N, c.-à-d. {x#? } est une suite numérique de 
Cauchy. Posons 
m=limazp et x—(x, 2e, ..., Œn). 


P — © 
Alors, il est évident que 
lim xP)= x. 
P—+ 00 

4-5. Pour démontrer que les espaces R° et R? sont complets on 
procède exactement de la même façon. 

6. Démontrons que l’espace C La, b] est complet. Soit {x, (t)} 
une suite de Cauchy de C [a, b]. Alors, pour tout & > 0, il existe un 
tel N que 

| Zn (£) — Tm (4) [<< E 


quels que soient n,m>Nett,a<t< b. Il en résulte que la suite 
{x, (t)} est uniformément convergente. Comme on le sait, dans ce 
cas sa limite x ({) est une fonction continue. En faisant tendre m 
vers l'infini dans l'inégalité précédente, on obtient 


[Ta ()—xz (IE 


pour tous les £{ el pour tous les nr > N, ce qui signifie que la suite 
{x, (t)} converge vers x ({) au sens de la métrique de l’espace C [a, b]. 

7. L'espace /l:. Soit {x° } une suite de Cauchy de /:. Alors pour 
tout & >> 0 il existe un tel N que 


p* (x), a) = 2 (af — 3m) Ce pour n,mDœN, (1) 
où 


at = (299, 289, 280, 


De (1) il résulte que pour tout Æ on a 
CR DES 


c.-à-d. que pour chaque k la suite de nombres réels {x}° } est une suite 


de Cauchy, donc une suite convergente. Posons x, — lim x}. 


Désignons par x la suite (x;, Zo, . . ., xx, . . .). Il s’agit de montrer 
que 
a) > IR < 00, C.-à-d. ZE, 
= 1 
b) lim p(xtm), x) —0. 


Nr 00 
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C'est ce que nous ferons. De l'inégalité (1) il résulte que pour tout M 
fixé on a 


D (af) — ap y 2€ €. 


Comme cette somme ne contient à présent qu’un nombre fini de 
termes, on peut, en fixant n, passer à la limite pour m —- co. Il vient 
M 
D (a —m)<e. 
k=—1 
Cette égalité est vraie pour tout M. Reconstituons la série infinie, 
en passant à la limite pour M —- ©; on obtient 


DCE @) 


OO 
La convergence des séries 2 (xs)? et (xx — z2)° entraîne la 


1 


SE 


convergence de la série Ÿ zh (en vertu de l'inégalité évidente: 
k=1 
(a + b}? L 2 (a? + b*)). L’affirmation a) est donc démontrée. 
D'autre part, comme € est aussi petit que l’on veut, l’inégali- 
té (2) signifie que 
lim p(x, x )= im y À (xf”? — 28) = 0, 
ñn— 00 


c.-à-d. que x‘ — x au sens de la métrique de /,. L’affirmation b) est 


ainsi démontrée. 
8. On vérifie facilement que l’espace C? [a, b] n’est pas complet. 
Considérons, par exemple, la suite de fonctions continues 


—1 pour —igi<——, 
Pn(t)={ ni pour — <i<— 
1 
14 pour —<i<1. 


C'est une suite de Cauchy dans C?[—1, 1], car 

1 

2 
2 
| (on (6) — pm EN <<: 
Pourtant elle ne converge vers aucune fonction de C? [—1, 1]. 

En effet, soient f une fonction quelconque de C? [—1, 1] et Ÿ une 
fonction discontinue, égale à —1 pour { 0 et à +1 pour { > 0. 


$ 3] ESPACES MÉTRIQUES COMPLETS 63 


En vertu de l'inégalité intégrale de Minkowski (qui est évidem- 
ment vraie aussi pour les fonctions continues par morceaux), on a: 


1 


(| CO—-roya"?< 
—1 
1 


1 
<( 1 en O0) 7 + À | GG) — PO) d) 7. 
{À — 1 


Comme la fonction f est continue, l’intégrale du premier membre est 
différente de zéro. D'autre part, il est clair que 
1 


dim À (pm ()— 1 (0))* di = 0. 


—1 


1 
Donc, l'intégrale 6 (£) — œ, (t))? dt ne peut pas tendre vers 
21 


zéro, quand 7 — co. 


Exercice. Démontrer que l’espace des suites bornées de nombres 
réels (exemple 9, $ 1) est complet. 


2. Théorème des boules emboîtées. En analyse on utilise largement 
une proposition, appelée théorème des segments emboîtés. Dans la 
théorie des espaces métriques un rôle analogue joue le théorème 
suivant que nous appellerons théorème des boules emboîtées. 


Théorème 1. Pour qu’un espace métrique R soit complet 
il faut et il suffit que toute suite de boules fermées emboîtées de R dont 
le rayon tend vers 0 ait une intersection non vide. 


Démonstration. Montrons que la conditionestnéces- 
saire. Supposons que l’espace À soit complet et considérons dans 
R une suite B,, BP», B3, ... de boules fermées emboîtées. Soient 
r, le rayon et x, le centre de la boule B,. La suite des centres {x,} 
est une suite de Cauchy, car p (2», tm) << rh pourm>netr, — 0, 
lorsque nr — oo. Comme À est complet, lim x, existe. Posons 

ñn—> 00 
x = lim 2: ; 


Ti — 00 


alors x € f\ B,. En effet, la boule B, contient tous les points de la 


n 
suite {14}, sauf, peut être, les points 2x4, xo, . . ., æn_1. Ainsi, x est 
un point adhérent à chaque boule B,. Etfcomme B, est un ensemble 
fermé, x € B, pour tous les n. 
Pour montrer que la condition est suffisante considérons 
dans À une suite de Cauchy arbitraire {x, } et démontrons qu’elle est, 
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convergente. La suite considérée étant une suite de Cauchy, on 
peut choisir, parmi ses termes, un point x, tel que p (x», Zn) < 


<< _ pour tous les nr > n,. Désignons par B, la boule fermée de centre 
Xn, et de rayon 1. Choisissons ensuite dans {x,} un point +,, tel que 


no >> Ni et p (tr, Tno) = pour tous les n >n,. Désignons par PB: 


la boule fermée de centre x,, et de rayon L De façon générale, si les 


points Zn, An,» + + + En, (ny no L...< ny) sont déjà choisis, 
choisissons un point 2, , tel que ny+, > nn et P (tn, En,,,) < 


1 Lé 
< jai POUr tous les ñr > n11,, et entourons-le d’une boule fermée 


R+1 


1 . . . 
B,+, de rayon R° En continuant cette construction, on obtiendra une 


suite de boules fermées emboîtées B, de rayons respectifs . Par 


9k-1 
hypothèse, cette suite de boules a un point commun; désignons-le 
par x. Il est clair que ce point x est la limile de la sous-suite {Zn,, }. 


Mais si une suite de Cauchy admet une sous-suite convergente vers 
x, elle converge elle-même vers x. Donc dans ce cas on peur eirire: 
x = lim *x,. 

NN — 00 


Le théorème est démontré. 


Exercices. 1. Démontrer que l'intersection des boules fermées emboi- 
tées du théorème précédent se réduit à un seul point. 


2. On appelle diamètre d’un ensemble M d’un espace métrique le nombre 
d(M)=— sup px, y}. 
x, yEM 


Démontrer que dans un espace métrique complet toute suite d’ensembles (non 
vides) fermés emboîtés, dont le diamètre tend vers zéro, admet une intersection 
non vide. 


3. Donner un exemple d'espace métrique complet ct, dans cet espace, d’une 
suite de boules fermées emboîtées dont l'intersection soit vide. 


4. Démontrer qu’un sous-espace d’un espace métrique complet À est complet 
si et seulement s’il est fermé dans R. 


3. Théorème de Baiïre. Le théorème qui suit joue un réle fonda- 
mental dans la théorie des espaces métriques complets. 


Théorème 2 (de Baire). Un espace métrique complet R 
ne peut pas être mis sous la forme d'une réunion dénombrable d'ensem- 
bles nulle part denses. 


Démonstration. Supposons le contraire. Soit À — 


= |] M, où chacun des ensembles M, est nulle part dense. Soit 


n— 
S, une boule fermée de rayon 1. Comme l’ensemble 7, est nulle 
part dense, il est non dense dans S,; il existe donc une boule fermée 
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S, de rayon plus petit que L telle que S, € Soet SN M, = GS. 
L'ensemble 7, étant non dense dans S,, la boule S, contient, pour 
la même raison, une boule fermée S, de rayon plus petit que _ telle 


que So AN Mo — @, elc. On obtient ainsi une suite de boules fer- 
mées emboîtées {S,} dont les rayons tendent vers zéro et telles que 


S, NA M, == @. En vertu du théorème 1 l'intersection fN %S, con- 
n—1 
tient un point x. Par construction, ce point n'appartient à aucun 
des ensemblés M, ; par conséquent, x & U M,, c.-à-d. R = | M,, 
n n 


ce qui contredit l’hypothèse. 

En particulier, fout espace métrique complet sans points isolés 
est non dénombrable. En effet, dans un tel espace tout point repré- 
sente un ensemble nulle part dense. 

4, Complétion d’un espace. Si À est un espace métrique non 
complet, il est toujours possible de le plonger (et, en un certain 
sens, de manière unique) dans un espace complet. 

Définition 2. Soit À un espace métrique. L'espace métri- 
que complet R* s’appelle complété de l’espace RÀ, si: 

1) R est un sous-espace de R* ; 

2) R est partout dense dans R*, c.-à-d. [R] — RY*. 

(Ici [LR] désigne, naturellement, la fermeture de l’espace R 
dans R*.) 

Par exemple, l’espace R! (exemple 2, $ 1) est un complété de 
l’ensemble des nombres rationnels (muni de la même distance). 


Théorème 3. Tout espace métrique R admet un complété 
et ce complété est unique à une isométrie près qui laisse invariants les 
points de R. 


Démonstration. Commençons par l’unicité. [Il nous 
faut démontrer que si R*Y et R** sont deux complétés de l’espace R, 
il existe une application biunivoque œ de l’espace R* sur R** telle 
que 

1) @ (x) = x pour tous les x ER; 

2) si a ++ 2#* et y* <> y**, alors p1 (x*, y*) — pa (2x**, y**), 
où p, est la distance sur R* et p, est la distance sur R**. 

On construit l’application @ de la manière suivante. Soit x* 
un point quelconque de R*. Alors, par la définition du complété, 
il existe une suite {x, } de points de À convergeant vers x*. Les points 
de {x,} appartiennent aussi à R**. Comme R** est complet, la 
suite {x,} converge dans R** vers un point x**. Il est clair que x** 
ne dépend pas du choix de la suite {x,} convergeant vers x*. Posons 
p (x*) — x**, L'application œ@ est l’isométrie cherchée. 


5—0167 


66 ESPACES MÉTRIQUES ET TOPOLOGIQUES [Ch. If 


En effet, par construction, @ (x) — x pour tous les x € R. Soit, 
d'autre part, 


{tn} —x* dans R* et {xal—>x** dans R**, 
{UYn} —y* dans R* et {yr}—y** dans R**; 
alors, comme la distance est une fonction continue, on a 
pa (x*, y*) = lim P1 (Zn; Yn) = lim p (x», Ya) 


ni — 00 
et, pour la même raison, 
Do (T**, y**) = lim po (Zn, Yn) = lim P (Tn, Y»). 
ñn—r 00 n— 00 


Par conséquent, 
Pi (a, y*) = pa (a, y**). 

Démontrons maintenant l'existence du complété. L'idée 
de cette démonstration est la même que dans la théorie cantorienne 
des nombres réels. Ici la situation est même plus simple que dans 
la théorie des nombres réels, car là pour les objets nouvellement 
introduits — les nombres irrationnels — on doit encore définir 
toutes les opérations arithmétiques. 

Soit À un espace métrique quelconque. Nous dirons que deux 
suites de Cauchy {z,} et {tr} de R sont équivalentes (notation 
{tn} — {tn}), Si Jim P (Zn: Zn) = 0. Le terme « équivalence » est 


justifié ici car la relation qu'on vient d'introduire est réflexive, 
symétrique et transitive. Il en résulte que toutes les suites de Cauchy 
que l’on peut former avec des points de l’espace R sont partagées 
en classes de suites équivalentes. Construisons maintenant l’espace 
R*. Admettons comme points de R* toutes les classes de suites de 
Cauchy équivalentes et définissons la distance entre elles de la 
manière suivante. Soient x* et y* deux de telles classes. Choisissons 
dans chacune d'elles un représentant, c.-à-d. une suite de Cauchy, 
soit {x,} et {y.,} respectivement. Posons !) 


p (x*, y*) — lim P (Zn; Un). (3) 


Démontrons que cette définition de la distance est correcte, 
c.-à-d. que la limite (3) existe et ne dépend pas du choix des repré- 


sentants {x,} € x* et {y,} E y*. 
Etant donné que {x,} et {y,} sont des suites de Cauchy, en vertu 


de l'inégalité 
| E (tn, Yn) — 0 (ms Ym) KP (Œns Lm) + P (Un, Ym); (4) 


1) Pour ne pas encombrer l'écriture, nous désignons la distance sur R*Y par 
le même symbole p que la distance sur l’espace initial R. 
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on à 
| 0 (tr, Un) TT 0 (Zm» Um) | < E 


pour tous les nr et m suffisamment grands. 

Ainsi, la suite de nombres réels s, — p (xx, Yn) vérifie la condi- 
tion de Cauchy et, par conséquent, a une limite. 

Cette limite ne dépend pas du choix de {x,} € x* et {y,} € y*. 
En effet, soient 


{tn}, {tn} Ex* et  {yn},{yn} EY*. 
Un calcul analogue à (4) donne 
TP (Tn, Yn) —P(Xn, Yn)|<P (Tn, Ta) HP (Un, Yn)- 
Puisque {x,} — {x} et {y,} — {yn}, on en déduit que 


lim p (Zn, Yn) = lim Pp (Zn, Yn). 
ñn— 00 n— 00 

Démontrons maintenant que dans R* tous les axiomes de l’espace 
métrique sont vérifiés. 

L’axiome 1) découle immédiatement de la définition des suites 
de Cauchy équivalentes. 

L’axiome 2) est évident. 

Montrons que l'inégalité triangulaire est aussi vérifiée. Comme 
dans l’espace initial À cet axiome est vérifié, on a 


P (En; 2n) < P (En; Un) + P (ns Zn). 
En passant à la limite pour n — ©, on obtient 
lim O (Zn, Zn) < lim P(XZn, Yn) + MP (Yn, Zn), 
ñn— 00 n—> 00 


c.-à-d. 
p (x*, 2*)<p (x*, y*) Ho (y*, z*). 


* 


Démontrons à présent que À peut être considéré comme un 
sous-espace de l’espace R*. 

À chaque point x € R correspond une classe de suites de Cauchy 
équivalentes, à savoir, l’ensemble des suites convergeant vers le 
point x. Cette classe n’est pas vide, car elle contient la suite station- 
naire dont tous les termes sont égaux à x. Par ailleurs, si 


xz=limxz, et y== lim y», 
n— 00 NN — 00 


alors 
px, y)= lim p (tn, yn)- 
n— 00 
Donc, en faisant correspondre à tout point x € R la classe x* 
de suites de Cauchy convergeant vers x, on obtient une application 
isométrique de À dans l’espace R*. 


5% 
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Par la suite, nous pouvons ne pas faire de distinction entre l’es- 
pace À et son image dans R*, c.-à-d. considérer À comme un sous- 
espace de R*. 

Montrons maintenant que À est partout dense dans R*. En effet, 
soit x* un point quelconque de RŸ et soit e >> 0 un réel arbitraire. 
Choisissons dans x* un représentant, c.-à-d. une suite de Cauchy 
{x,}. Soit NV tel que p (x, x) << € pour tous les n, m> N. On 
a alors 


P(Xn, 2*)= lim p(Tn, Lm) LE 


quel que soit n > N, ce qui signifie que tout voisinage du point 
x* contient un point de À. Par conséquent, la fermeture de Æ dans 
R®% coïncide avec R* tout entier. 

Il reste à démontrer que R* est complet. Remarquons tout d’abord 
que par la construction de R* toute suite de Cauchy 


AE T9, CCE Ln) . + 


de points de À converge dans R* vers un certain point, plus préci- 
sément, vers le point x* € R* défini par cette suite même. D'autre 
part, comme À est dense dans RŸ, pour toute suite de Cauchy x°, 
2#, . .., än, - .. de points de RÀ* on peut construire une suite 
équivalente x4, Lo, + . ., En, . . . de points de À. À cet effet, il 


suffit de prendre pour x, n’importe quel point de À tel que p (x,, x) < 
<—. La suite {x,} ainsi construite est une suite de Cauchy dans À 


et, par définition, converge vers un point x* € R*. Mais alors la 
suite {x%} converge aussi vers x*. 
Le théorème est complètement démontré. 


$ 4. Le principe des contractions 
et ses applications 


1. Principe des contractions. De nombreuses questions, liées 
à l'existence et à l’unicité des solutions de certains types d'équations 
(par exemple, des équations différentielles), peuvent être ramenées 
à la question d’existence et d’unicité d’un point fixe pour une appli- 
cation de l’espace métrique correspondant dans lui-même. Parmi 
les différents critères d'existence et d’unicité d’un point fixe pour 
de telles applications, l’un des plus simples et à la fois des plus 
importants est celui qui porte le nom de principe des contractions. 

Soit À un espace métrique. Une application À de l’espace R 
dans lui-même est appelée application contractante ou simplement 
contraction, s’il existe un nombre &« << 1 tel que pour tout couple de 
points x, y € R on a l'inégalité 


p (4x, Ay) < ap (x, y). (1) 
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Toute application contractante est continue. En effet, si x, — x, 
en vertu de (1) on a également Az, — Ax. 

On dit que x est un point fixe pour l'application À, si ÀAx = x. 
Autrement dit, les points fixes sont les solutions de l'équation 
AX = &. 


Théorème 1. (Principe des contractions). 
Toute contraction, définie sur un espace métrique complet R, admet un 
point fixe et un seul. 


Démonstration. Soit x, un point arbitraire de À. Posons 
Li=AÀX%o, L—= Ati — À°xo, ..., Xn = Atn1 = AX. 
Montrons que {x,} est une suite de Cauchy. En effet, en posant, 
pour fixer les idées, m >nona 
p (Tr; Tm) — P (4°, At) ap (To; Tm-n) < 
<a” {p (to, T1) + p (ts, x) + . + P (Tm-n-11 TIm-n)} 
1 
<a”p (to, 21) {1+a+a+... Ha} <ap (to, M) - 
Comme & << 1 pour n assez grand cette quantité peut devenir aussi 


petite que l’on veut. L'espace R étant complet, la suite de Cauchy 
{x,} a une limite dans À. Posons 


x = lim 7h. 


NN — 00 
Alors, en vertu de la continuité de l’application À, on a 


Azx= Alim x, =lim Az» lim Zny1 = «x. 


nr 00 ñn— 00 n — 00 


L'existence du point fixe est donc démontrée. Démon- 
trons l’'unicité de ce point. Si 


Az = x, Ày = y, 
l'inégalité (1) prend la forme 
p (æ, y) < ap (x, y); 
comme & <Z À, il vient 
p (x, y) = 0, c.-à-d. x = y. 


Exercice. Montrer sur un exemple que l'application À qui vérifie la 
condition p (4x, Ay) < p (x, y) pour tous les x -£ y peut ne pas avoir de point 
ixe. 


2. Applications simples du principe des contractions. Le principe 
des contractions peut être appliqué à la démonstration du théorème 
d'existence et d’unicité de la solution pour de nombreux types d’équa- 
tions. Outre la démonstration de l’existence et de l’unicité de la 
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solution de l’équation Ax — x, le principe des contractions fournit 
une méthode effective de calcul approché de cette solution(métho- 
de des approximations successives). Examinons 
les exemples simples suivants. 

1. Soit f une fonction définie sur le segment [a, b] qui vérifie 
la condition de Lipschitz 


[fr —f() I<K x: — x | 
avec une constante À < Î et qui représente une application du seg- 
ment [a, b] dans lui-même. Alors f est une contraction et, d’après 


0 a x X3X> X; X0 ê X 0 &Xo XaXYXX3 X! U X 
Fig. © Fig. 10 


le théorème démontré, la suite xo, 21 = f (to), 2 = f (x1), 
converge vers la racine unique de l’ équation x = f (x). 
En particulier, f est une contraction, si elle est dérivable sur le 


segment [a, bl et 
IF (HI<K<TI. 


Les figures 9 et 10 représentent la marche des approximations 
successives pour 0 << f” (x) 1 et pour —1 < f’ (x) < 0. 

Soit maintenant une équation de la forme F (x) = 0! telle que 
F(a)<0, F(b)>0 et O<K,< F'(x) < K; sur [a, ‘bl. Intro- 
duisons la fonction f (x) — x — ÀF (x) et cherchons la solution de 
l'équation x — f(x), équivalente à F (x) — 0. Comme f' (x) — 
—1— XF" (x), on a 1—AK,<f' (x) L1—AK,; il est donc possible 
de choisir À de façon qu’on puisse appliquer la méthode des appro- 
ximations successives. C’est une méthode répandue de recherche des 
racines. 

2. Considérons une application À d’un espace à n dimensions 
dans lui-même, donnée par le système d'équations linéaires 


n 
yi= D dix j +b: (Gi = 1, 2, .., n). 
j—=1 


Si À est une contraction, nous pouvons appliquer la méthode 
des approximations successives à la résolution de l’équation x = Az. 
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À quelles conditions donc l'application À est-elle une contrac- 
tion? La réponse à cette question dépend du choix de la métrique. 
Examinons les trois cas suivants. 

a) Espace KR, c.-à-d. p (x, y) = max | x; — y; |; 

1<i<n 
p(y', y}=max|gi—yi|=max (Dai; (x — 25) |< 
1 L J 
<max D la;llti—zxi|<max)|a;;|max|x;— x] 
L J î J J 


= (max Yes) p (a, 2. 


D'où la condition cherchée : 


> la;l&a<1, i—=4Â,...,n. (2) 
j=1 
b) Espace R?, c.-à-d. p (x, y) = D 1x; — y: |; 
i—=1 


PQ = Dlui-l= la (ai—a)l< 


<DDlallei—2i1<(max late (s, x"). 
1 1 

D'où la condition cherchée : 

D'la;l<a<1, j=1,...,n. (3) 


î 


c) Espace R”, c.-à-d. p (x, y) — V/ D '(x;: — y;). En vertu de 
i=1 


l'inégalité de Cauchy-Bouniakovsky on a 


p°(y',y)=> C2 aij(xi— 25)) < C2 a?;) p° (x, x"). 


î 
D'où la condition cherchée : 
DD a<a<i. (4) 
1 9 
Donc, si l’une au moins des conditions (2)-(4) est vérifiée 1), 
ñn 
il existe un point et un seul (x,, 2, . . ., æ,) tel que x; — > G;jtj + 
j=1 
1) En particulier, chacune des conditions (2)—(4) implique que 


dy — 1 d12 CR din 


doi A2 — 1 ...  Gon 
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+ b;; les approximations successives de cette solution sont de Ia 
forme suivante : 


0 0 0 
20 = (29, 28), ..., 39), 

(1) (1 (1) 
zx = (æi » À2 , ss n ), 

L k L 
200 = (299, 20 a) 


et en qualité de x'° — (x,°, ..., xŸ°) on peut prendre n'importe quel 
point de R. 

Chacune des conditions (2)-(4) est suffisante pour que 
l'application y = Ax soit une contraction. Quant à la condition 
(2), on pourrait démontrer qu'elle est aussi nécessaire pour 
que l’application y — Ax soit une contraction (au sens de la métri- 
que a)). 

Aucune des conditions (2)-(4) n’est nécessaire pour l’application 
de la méthode des approximations successives. 


Si [a; | << 7 , toutes les trois conditions (2)-(4) sont vérifiées 


et la méthode des approximations successives est manifestement 
applicable. 


Si la;;| > _ , aucune des conditions (2)-(4) n’est vérifiée. 


3. Théorèmes d'existence et d’unicité pour les équations diffé- 
rentielles. Au numéro précédent nous avons examiné deux exemples 
simples d'application du principe des contractions dans un espace 
à une dimension et dans un espace à nr dimensions. Pourtant, en 
analyse les applications les plus importantes de ce principe apparais- 
sent dans le cas des espaces fonctionnels de dimension infinie. Nous 
allons montrer maintenant, comment à l’aide de ce principe on peut 
démontrer le théorème d'existence et d’unicité de la solution pour 
certains types d'équations différentielles et d'équations intégrales. 

1. Problème de Cauchy. Soit une équation différen- 
tielle 


dy 
à condition initiale 
y (x) — Yo; (6) 


où la fonction f est définie et continue dans un domaine plan G con- 
tenant le point (xo, yo) et vérifie dans ce domaine la condition de 
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Lipschitz par rapport à y: 
LG, ya) — f Ge, ge) | M Ty — y. 


Démontrons qu’il existe alors uné solution et une seule y — 
— (x) de l’équation (5), définie sur un segment [x — x | < d 
et satisfaisant à la condition initiale (6) (théorème de Picard). 

L'équation (5) avec la condition initiale (6) est équivalente à 
l'équation intégrale 


TOC (6) dé. (7) 


En vertu de la continuité de f on a | f (x, y) | << K dans un domaine 
G" © G contenant le point (x0o, yo). Choisissons d > 0 de façon que 
les conditions suivantes soient vérifiées : 

1) (&, y) EG’, si [x —zo1<d, | y — yo | K Kd 

2) Md<1i. 

Désignons par C* l’espace des fonctions continues œ, définies 
sur le segment | x — xo | & d et telles que | (x) — yo | KL Kd, 
doté de la métrique 


P (Es Pa) max [Qu (x) — 2 (x) |: 
L'espace C'* est complet, comme un sous-espacc fermé de l’espace 


complet des fonctions continues sur [xs — d, xo + dl. Considérons 
l'application  — A définie par la formule 


(x) = ÿo+ } FE, p(E) dé, 


où | x — To | L d. C'est une application de l’espace complet C* 
dans lui-même el représente une contraction dans cet espace. En 
effet, soit € C*, | x — xo | & d. Alors on a 


Cul ft g() dt <Kd 
et donc À (C*) & C*. D'autre part. 
PTE CAT OUEIT OIL 
L < Md max | 1 (x) — pe (x) |. 


Comme Md << 1, À est une contraction. 
Il en résulte que l'équation @ = Aç (c.-à-d. l'équation (7)}) 
admet dans l’espace C* une solution et une seule. 
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2. Problème de Cauchy pour un système 
d'équations. Soit donné un système d'équations différentielles 


pi(x)—=f;(x, pi(x), ..., Pnx)), i—=1, 2, ...,n, (8) 

à conditions initiales 
Pi (Lo) — Yoi, à — 1, 2, ..., n, (9) 
où les fonctions f; sont définies et continues dans un domaine G de 
l’espace R"*1 contenant le point (xo, Yo, + + +, Yon) et vérifient la 


condition de Lipschitz 


| fi (zx, y}, .….. y f(x, y}, ...) UN |<M max [y — y |. 
1<i<n 

Démontrons qu'il existe alors sur un segment [x —zxo|<d 
une solution et une seule du problème initial (8), (9), c.-à-d. un 
système et un seul de fonctions ®;, satisfaisant aux équations (8) 
‘et aux conditions initiales (9). 

Le système (8) avec les conditions initiales (9) est équivalent 
au système d'équations intégrales 


X 


qua) = yo À FC pu), ..., pn))dt, i=1,2,...,n. (10) 
X0 
En vertu de la continuité, les fonctions f;, sont bornées dans un 
domaine G° © G contenant le point (to, Yot; + + +» Yon); C--à-d. il 
existe une constante Æ telle que | f; (x, ya, . . ., Un) | L À. 
Choisissons d > 0 de façon que les conditions suivantes soient 
remplies : 


D Gun.) EG, Si [r—zxo|<d, | y; — yoi | < Kd; 
i—1,2,...,n; 


2) Md < 1. 

Considérons l’espace C? ayant pour éléments les systèmes @ — 
— (D, . . ., Pr) de n fonctions définies et continues pour | x — xo [SK 
< d et telles que | ®; (x) — yo; | L Kd. Définissons la métrique 
par la formule 


p (p, p)= max |: (x) — ÿ; (x) |. 


L'espace ainsi défini est complet. L'application d — A, donnée 
par le système d’égalités 
X 


bi (æ) = voit | Ji (t, P1(E), + .., Pn (£)) dt, 


XO 


est une application contractante de l’espace complet C3 dans lui- 
même. 
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En effet, 


DD (a) —p (a) = À 1f (6 pÉ (0, pi? (1) — 


X0 


—fi(t pŸ (0, ..., pÙ (D)1dt 
et, par conséquent, 
max | (2) — pi? (2) 1 Md max | qi? (x) — qi? (x)|. 


L'application À est une contraction, car Md< 1. 

Il s'ensuit que l'équation opératorielle @ — Ag admet dans 
l’espace C* une solution et une seule. 

4. Application du principe des contractions aux équations inté- 
grales. 

1 Equations de Fredholm. Utilisons maintenant 
la méthode des contractions pour démontrer l'existence et l’unicité 
de la solution d’une équation intégrale linéaire non homogène de 
Fredholm de deuxième espèce, c.-à-d. d’une équation de la forme. 


b 
f(a)= AT K (a, 1) iQ) dy+e (@), (11) 


où Æ (le noyau) et ® sont des fonctions données, f est la fonction cher- 
chée et À est un paramètre arbitraire. 

Nous verrons que ladite méthode n’est applicable que pour des 
valeurs assez petites du paramètre À. 

Supposons que À (x, y) et p (x) soient continues pour a < x < b, 
a<y<b et donc | X(x,y)| < M. Considérons l'application 
g — Af de l’espace complet C [a, b] dans lui-même, donnée par la 
formule 

b 


g(a)= 2 À Ke, y) 1) dy+e (a). 


a 


On a 


D (gi, 2) = max [gi (x) — g)|l< 
LIAIM(b — a) max | fi (x) — f2 (x) |. 


Par conséquent, pour À < Te l'application À est contractante. 


) 


D'après le principe des contractions on conclut que pour tout À 


tel que |À | < Te l'équation de Fredholm admet une solu- 


tion continue unique. Les approximati ons successives de cette solu 
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tion fo; fa, + + +, fn, - . . sont de la forme 
b 
fn (2) = | K (æ, 9) fn (y) dy +6 (a) 
où en tant que f, (x) on peut prendre n'importe quelle fonction con- 
tinue. 

2. Equations intégrales non linéares. Le 
principe des contractions peut être appliqué aussiauxéquations 
intégrales non linéaires du type 

b 
f(a)=2 À Ka, 15 f (8) dy+e (a), (12) 
a 
où K et @ sont des fonctions continues et, en outre, le noyau XÀ satis- 
fait à la condition de Lipschitz par rapport à sa variable « fonction- 
nelle » : 
IH y;u)— KG, y;2)1< M] — 21. 


Dans ce cas, pour l'application g — Àf de l’espace complet C [a, b] 
dans lui-même, donnée par la formule 


b 
g(x)=2 | K (x, y; f(y))dy+op(x), (13) 


on a l'inégalité 
max | 81 (x) — g2 (x) | LI X | M (b — a) max | f, (x) — 2 (x) |, 


1 ; . 
Où g, — ÀAfy, go — Afs Donc, pour |À | < CET) l’applica- 
tion À est contractante. 

3. Equations de Volterra. Considérons enfin l'équa- 
tion intégrale de Volterra: 


x 


f(a)=2 À K (e, 9)+f (u) duo (a). (14) 


a 


Ici, à la différence des équations de Fredholm, l'intégrale a pour 
borne supérieure la variable x. Formellement cette équation peut 
être considérée comme un cas particulier de l'équation de Fredholm, 
en prolongeant la fonction K par l'égalité 


K (x, y) = 0 pour y > x. 


Pourtant, si dans le cas d’une équation intégrale de Fredholm 
nous étions contraints à nous borner aux valeurs suffisamment 
petites du paramètre À, dans le cas d’une équation de Volterra le 
principe des contractions (et la méthode des approximations suc- 
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cessives) est applicable pour toutes les valeurs de À. Plus précisé- 
ment, il s’agit de la généralisation suivante du principe des con- 
tractions : 

Soit À une application continue de l’espace complet R dans lui- 
même dont une puissance B — A" est contraction; alors l'équation 


Az = x 
a une solution et une seule. 
En effet, soit x un point fixe de l’application B, c.-à-d. Bx = x. 
On a: 
Axz= AB'x=B'Ax— B'x,—x (k—o), 
car, l'application B étant contractante, la suite Bx,, B°x,, B°xo, . .. 
converge pour tout xs € R vers le point fixe x de l’application B. 
Par conséquent, 
Ax = tx. 


Ce point fixe est unique, car tout point fixe pour l’application À 
est fixe aussi pour l’application contractante A” qui ne peut avoir 
qu'un seul point fixe. 

Montrons maintenant qu'il existe une puissance de l’application 


Af(æ)= à Ÿ Ka, nf (9) dy+9% 


possédant la propriété d’être contraction. Soient f, et f, deux fonc- 
tions continues sur le segment [a, b]. Alors 


LAf Ce) —4f (SIA) Ge D (GG) —f2 0) dl < 


| [AIM (x—a) max] f(x) — f(x) |, 


où 
M = max | À (x, y) |. 
On en déduit que 
_ ay? 
| A°f (e) — Aa (2) ITA PME ET max | fi (2) — fe (0) | 
et, plus généralement, 
| A" (x) — A" fa (æ) | SIA MED m8 LA" Mm 


où m = max | fi (x) — fe (x) |. 
Pour toute valeur de À le nombre n peut être choisi assez grand 
pour que 


(b— an 
n! ? 


LA [nr Mn (b— ayr 
TT < 1. 


Alors l’application À” sera une contraction. Par conséquent, l’équa- 
tion de Volterra (14) admet pour tout À une solution et une seule. 
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$ 9. Espaces topologiques 


1. Définition et exemples d’espaces topologiques. Les notions 
fondamentales de la théorie des espaces métriques (point d’accumu- 
lation, point adhérent, fermeture d’un ensemble, etc.) ont été intro- 
duites à l’aide de la notion de voisinage ou, ce qui en fait revient 
au même, à l’aide de la notion d'ensemble ouvert. À leur tour, ces 
dernières notions (voisinage, ensemble ouvert) ont été définies 
à l’aide de la métrique, donnée dans l’espace considéré. Cependant, 
on peut suivre une autre voie: n'introduire dans l’ensemble donné 
R aucune métrique et définir dans À les ensembles ouverts directe- 
ment, au moyen des axiomes. Cette voie qui offre beaucoup plus 
de liberté d'action conduit à la notion d'espace topologique dont 
l’espace métrique est un cas quelque peu spécial, bien que très 
important. 

Définition. Soit À un ensemble quelconque que nous 
appellerons support. On appelle topologie de X toute famille t de 
sous-ensembles G € X satisfaisant aux conditions suivantes: 

1°. L'ensemble X lui-même et l’ensemble vide @ appartiennent. 
à T. 

2°. Toute réunion |} G, (finie ou infinie) et toute intersection 

n œ 
finie |] G; d’ensembles de T appartiennent à T. 


k=—1 

L'ensemble X avec une topologie donnée +t, c.-à-d. le couple 
(X, t), s’appelle espace topologique. 

Les ensembles appartenant à la famille t& sont dits ouverts. 

De même qu’un espace métrique est formé par un ensemble de 
points («support ») et une métrique définie sur cet ensemble, un 
espace topologique est formé par un ensemble de points et une topo- 
logie définie sur cet ensemble. Donc, donner un espace topologique, 
c’est donner un ensemble X et dans cet ensemble donner une topolo- 
gie t& c.-à-d. indiquer les sous-ensembles de X qui seront considérés 
comme ouverts. 

Il est clair quesur un même ensemble X on peut définir 
des topologies différentes, de sorte que cet ensemble peut être le 
support des espaces topologiques différents. Tout de même, nous 
désignerons un espace topologique, c.-à-d. un couple de la forme 
(X, t) par une seule lettre, par exemple, T. Les éléments d'un 
espace topologique seront appelés points. 

Les complémentaires TG des ensembles ouverts sont appelés 
ensembles fermés de l’espace topologique T. Des axiomes 1° et 2° 
il résulte en vertu des relations de dualité ($ 1, chap. I) que: 

1. L'ensemble vide @ et l’espace T tout entier sont des ensem- 
bles fermés. 

2. Toute intersection (finie ou infinie) et toute réunion finie 
d’ensembles fermés sont des ensembles fermés. 
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Sur la base de ces définitions on introduit de façon naturelle dans 
tout espace topologique les notions de voisinage, de point adhérent, 
de fermeture d’un ensemble, etc. Plus précisément : 

On appelle voisinage d’un point x € T tout ensemble ouvert 
G © T contenant le point z; un point x € T est appelé point adhé- 
rent à un ensemble M © T, si tout voisinage de x contient au moins. 
un point de M ; on dit que x est un point d’accumulation de l’ensem- 
ble M, si tout voisinage de x contient au moins un point de M autre 
que x. L'ensemble des points adhérents à l’ensemble M s'appelle 
fermeture de M et se note [A7]. On démontre sans peine (cette démons- 
tration est laissée au lecteur) que les ensembles fermés (considérés, 
conformément à la définition ci-dessus, comme complémentaires 
des ensembles ouverts) sont les seuls qui vérifient la condition [M] — M. 
Ainsi que dans le cas d'un espace métrique, [MI] est le plus petit ensemble. 
fermé contenant M. 

La définition des ensembles boréliens, formulée à la page 56: 
pour les espaces métriques, s'étend mot pour mot aux espaces topo- 
logiqus. 

Exercice. Démontrer que l’opération de fermeture [M], définie à l’aide 
de la topologie, possède les propriétés 1)—4) formulées dans le théorème 1, $ 2. 


Exemples. 1. En vertu du théorème 3”, $ 2, les ensembles 
ouverts de tout espace métrique satisfont aux axiomes 1° et 2° de 
la définition d’un espace topologique. Par conséquent, tout espace: 
métrique est en même temps un espace topologique. 

2. Soit T un ensemble quelconque. Considérons comme ouverts 
tous ses sous-ensembles. Il est évident que les axiomes 1° et 2° sont 
vérifiés; donc, on obtient bien un espace topologique. Dans cet. 
espace tous les ensembles sont à la fois ouverts et fermés et donc, 
chacun d’eux coïncide avec sa fermeture. Une topologietriviale 
de cette sorte est, par exemple, celle de l’espace métrique indiqué: 
dans l’exemple 1, $ 1. 

3. Un autre cas extrême peut être obtenu, si dans un ensemble. 
quelconque X on considère la topologie dont les seuls ensembles 
sont X et G. Dans ce cas la fermeture de chaque ensemble non vide 
coïncide avec À tout entier. Un tel espace topologique peut être 
appelé « espace de points collés ». 

4. Soit T un ensemble constitué de deux points a et b. Considé- 
rons comme ouverts l’ensemble 7 tout entier, l’ensemble vide et 
l’ensemble formé du seul point b. Les axiomes 1° et 2° sont vérifiés. 
Dans cet espace (que l’on appelle souvent couple de points connexe) 
les ensembles fermés sont: 7 tout entier, l’ensemble vide et l’en- 
semble dont le seul élément est a. La fermeture du singleton {b} 
est T tout entier. 


Exercice. Construire toutes les topologies possibles d’un ensemble X 
de deux, trois, quatre et cinq éléments. 
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2. Comparaison des topologies. Soient deux topologies ti et % 
définies sur un même support X (on a alors de u x espaces topolo- 
giques T4 = (X, ti) et To = (X, t2)). On dit que la topologie 7, 
est plus forte ou plus fine que la topologie t,, si la famille d'ensembles 
T2 est contenue dans Tt,. Dans ce cas on dit encore que la topologie 
T, est plus faible ou plus grossière que v.. 

Dans l’ensemble de toutes les topologies possibles de l’ensemble X 
on introduit de façon naturelle une relation d'ordre partiel (la topo- 
logie t, précède 7:, si elle est plus faible que t,). Dans cet ensemble 
de topologies il existe un élément maximal : la topologie contenant 
comme ouverts tous les sous-ensembles de X (exemple 2), et un élé- 
ment minimal : la topologie qui ne contient comme ensembles ouverts 
que À et @ (exemple 3). 


Théorème 1. Toute intersection Tt — (7, de topologies 


œ 
de X est une topologie de X. Cette topologie 7 est plus faible que chacune 
des tapologies T. 


Démonstration. Ilest clair que f] t%, contient X et @. 
œ 


D'autre part, comme chacun des ensembles Tt, est clos pour toute 
réunion et pour toute intersection finie de ses éléments, il en est 
de même de leur intersection T = f] T,. 


Œ 

Corollaire. Soit Ÿ une famille quelconque de parties de X ; 
il existe alors une topologie minimale de X contenant . 

En effet, il existe des topologies contenant ® (par exemple. 
celle qui contient comme ensembles ouverts tous les À & X). L'’in- 
tersection de toutes ces topologies est la topologie cherchée. On dit 
que cette topologie minimale est engendrée par la famille $ et on 
la note t (#). 

Soit X un ensemble quelconque et À un sous-ensemble de X. On 
appelle trace de la famille Ÿ sur le sous-ensemble À la famille #, 
des parties de X de la forme À f] B, B € #. Il est aisé de voir que 
la trace (sur À) de latopologie 7t (définie sur X) est une topo- 
logie t1 de À. Ainsi donc, tout sous-ensemble À d’un espace topolo- 
gique est lui-même un espace topologique. L'espace topologique 
(A, TA) est appelé sous-espace de l’espace topologique initial (X, +). 
Il est clair que deux topologies distinctes t, el t,: de X peuvent 
engendrer une même topologie de À & X. La topologie t, s'appelle 
topologie induite par t sur À. 

3. Systèmes fondamentaux de voisinages. Base. Axiomes de dénom- 
brabilité. Comme nous avons déjà vu, définir une topologie sur un 
ensemble quelconque c’est donner dans cet ensemble la famille 
des ensembles ouveris. Mais dans des problèmes concrets il est sou- 
vent commode de donner seulement une partie de la topologie, plus 
précisément une famille d’ensembles ouverts, à partir desquels on 
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peut déterminer de façon unique tous les ensembles ouverts de la 
topologie. Ainsi, par exemple, dans un espace métrique nous avons 
introduit d’abord la notion de boule ouverte (e-voisinage) et défini 
ensuite les ensembles ouverts comme ensembles contenant avec tout 
point un e-voisinage de ce point. Autrement dit, dans un espace 
métrique un ensemble est ouvert si et seulement s’il est une réunion 
(finie ou infinie) de boules ouvertes. En particulier, sur la droite 
numérique un ensemble est ouvert si et seulement s’il est une réu- 
nion d’intervalles. Ces considérations nous conduisent à la notion 
importante de base d’un espace topologique. 

Définition. Une famille & d’ensembles ouverts s'appelle 
base de l’espace topologique 7, si tout ensemble ouvert de T peut 
être représenté comme une réunion (finie ou infinie) d’ensembles de #. 

Ainsi, par exemple, l’ensemble des boules ouvertes (de centre et 
rayon arbitraires) d’un espace métrique est une base de cet espace. 
En particulier, l’ensemble de tous les intervalles est une base de la 
droite numérique. On obtiendra de même une base de la droite 
numérique, en se bornant aux intervalles à extrémités rationnelles, 
car tout intervalle et donc tout ensemble ouvert de la droite numé- 
rique peut être représenté comme une réunion de tels intervalles. 

Ainsi donc, la topologie t d’un espace T peut être donnée en 
indiquant une base $ de cet espace; cette topologie t coïncide 
alors avec la famille d'ensembles qui peuvent être représentés sous 
forme de réunions d’ensembles de &. 

Toute base Ÿ d’un espace topologique T — (X, t) jouit des 
deux propriétés suivantes : 

1) tout point x € X appartient au moins à un ensemble G € 9, 

2) si x appartient à l'intersection de deux ensembles G; et G; de $, 
il existe un ensemble G; € $ tel que 


126GCG MN Go 


En effet, la propriété 1) signifie tout simplement que l’ensemble 
X, en tant qu'ensemble ouvert, doit représenter une réunion d'’en- 
sembles de & ; quant à la propriété 2), elle résulte du fait que G, f| 
N G: est un ensemble ouvert et représente donc une réunion d'’en- 
sembles de la base #. 

Réciproquement, soit À un ensemble quelconque et & une famil- 
le de parties de X possédant les propriétés {) et 2). Alors, la famille 
d’ensembles qui peuvent être représentés sous forme de réunions 
d’ensembles de Ÿ est une topologie sur X (c.-à-d. vérifie les axiomes 
1° et 2° de l’espace topologique). 

En effet, soit t (#) la famille contenant tous les sous-ensembles 
de À qui peuvent être mis sous forme de réunions d’ensembles de #. 
Alors, l’ensemble vide !), l’ensemble X tout entier et toute réunion 


1) Il peut être considéré comme la réunion d'une collection vide d'ensembles 
de la famille & 


6—0167 
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d’ensembles de t ($) appartiennent à t (£&). Montrons que toute 
intersection finie d’ensembles de + (&) appartient à t (9). Il suffit 
de vérifier cela pour l'intersection de deux ensembles. Soient À — 
U G, et B — U Ge: alors À NN B — U, (Ga MN Gp). En vertu 
œ Œ 


de la propriété 2), tout ensemble G, N G4 appartient à t (8). Il 
en résulte que À A BE 7 (5). 

Ainsi, nous avons obtenu le résultat suivant. 

Théorème 2. Pour qu'une famille $ de parties G d'un ensem- 
ble X soit la base d'une topologie de X, il faut et il suffit que $ possède 
les propriétés 1) et2)}. 

.. Soit maintenant t une topologie bien déterminée de l’espace T. 
Considérons dans T une famille $& d'ensembles ouverts jouissant 
des propriétés 1) et 2). En adoptant # comme base, nous obtiendrons, 
évidemment, une topologie t ($&) de T coïncidant avec la topologie 
initiale + ou plus faible que celle-ci. On se propose d'établir, à quelles 
conditions la famille & engendre exactement la topologie donnée Tr. 


Théorème 3. Pour qu’une famille d'ensembles ouverts 8 & + 
soit base de la topologie Ÿ, il faut et il suffit que: 
3) pour tout ensemble ouvert G et tout point x € G il existe un 


ensemble G, € ÿ telquex EG; EG. 
Démonstration. Si la condition 3) est vérifiée, tout 


ensemble ouvert G& peut être mis sous la forme 


G= Ü (ER 
xeG 


— 


ce qui signifie que # est une base de la topologie t. Inversement, 
si # est une base de la topologie t, tout ensemble G € t peut être 
représenté comme une réunion d’ensembles de # et alors pour tout 


x EGil existe un ensemble G, € $ tel quex EG EG. 


Exercice. Soient %,: et £&> deux bases de topologie dans X (c.-à-d. 
deux familles d’ensembles satisfaisant aux conditions 1) et 2) p. 81) et vw et T 
les topologies qu’elles définissent. Démontrer que t1 t2 si et seulement si 
pour tout G1 € $1 et tout point x € G il existe un ensemble G: € £2 tel que 
TZ € Ge Gi. 

À l’aide du théorème 3 on démontre facilement, par exemple, que 
dans tout espace métrique l’ensemble de toutes les boules ouvertes 
est une base de sa topologie. Il en est de même pour l’ensemble de 
toutes les boules de rayon rationnel. Sur la droite numérique on 
obtient une base si l’on considère par exemple l’ensemble des inter- 
valles rationnels (c.-à-d. à extrémités rationnelles). 

Une classe importante d'espaces topologiques est formée par 
les espaces à base dénombrable, c.-à-d. par les 
espaces possédant au moins une base comportant un nombre fini 
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ou une infinité dénombrable d’ensembles. Les espaces à base dénom- 
brable s'appellent aussi espaces satisfaisant au deuxième axiome de 
dénombrabilité. 

Si l’espace topologique T possède une base dénombrable, alors il 
existe un ensemble dénombrable partout dense dans T, c.-à-d, un ensem- 
ble dénombrable dont la fermeture coïncide avec 7. En effet, soit 
{G, } une telle base. Choisissons dans chacun de ses éléments un point 
arbitraire x,. L'ensemble dénombrable X = {xr,} est partout dense 
dans 7, car dans le cas contraire l’ensemble ouvert non vide G — 
— TKIXT] ne contiendrait aucun point de X, ce qui est impossible, 
étant donné que G est une réunion d’ensembles de la famille {G, } 
et Zn E Gn. 

Les espaces topologiques possédant un ensemble dénombrable 
partout dense, de même que les espaces métriques, sont dits séparables. 

Pour les espaces métriques on a aussi le théorème réciproque de 
celui que nous venons de démontrer : 

Si l’espace métrique R est séparable, il possède une base dénombrable. 
En effet, une telle base est, par exemple, l’ensemble des boules 
ouvertes B (x,, 1/m), où {x,} est un ensemble dénombrable partout 
dense, n et m parcourent indépendamment l’un de l’autre l’ensemble 
des nombres naturels. On a donc le théorème suivant : 


Théorème 4. Un espace métrique R possède une base dénom- 
brable si et seulement s'il est séparable. 


En vertu de ce théorème tous les exemples d’espaces métriques 
séparables peuvent servir d'exemples d'espaces métriques satisfai- 
sant au deuxième axiome de dénombrabilité. L'espace non séparable 
des suites bornées (cf. exemple 9 $ 1) n’a pas de base dénombrable. 

Remarque. Le théorème 4 n’est pas, en général, vrai pour 
des espaces topologiques arbitraires (non métriques): on peut indi- 
quer des exemples d’espaces séparables sans base dénombrable. 
Donnons une explication de ces phénomènes. Dans un espace métri- 
que À il existe pour tout point x un ensemble dénombrabley 
de voisinages (par exemple, l’ensemble des boules ouvertes B (x, 1/n)) 
possédant la propriété suivante : quel que soit l’ensemble ouvert G 
contenant le point x, il existe dans Ü un voisinage de x, contenu 
tout entier dans G. Un ensemble tel que U s'appelle système fonda- 
mental de voisinages du point x. 

Si le point x d’un espace topologique 7 possède un système fonda- 
mental de voisinages, on dit que ce point satisfait au premier axiome 
de dénombrabilité. Si cela a lieu pour tout point de l’espace T, on 
dit que cet espace satisfait au premier axiome de dénombrabilité. 

Tout espace métrique, même non séparable, satisfait manifeste- 
ment au premier axiome de dénombrabilité. Pourtant dans un espa- 
ce topologique arbitraire (même s’il n’est que dénombrable) le 
premier axiome de dénombrabilité peut ne pas avoir lieu. C’est 


6* 
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pourquoi les raisonnements qui nous ont permis dans le cas d’un 
espace métrique de conclure que l'existence d’un ensemble dénom- 
brable partout dense implique l'existence d’une base dénombrable 
ne sont plus valables dans le cas d’un espace topologique arbitraire. 
Du reste, même dans un espace topologique séparable satisfaisant 
au premier axiome de dénombrabilité il peut ne pas y avoir de base 
dénombrable. 

Une famille d’ensembles {17,} est appelée recouvrement de l’en- 
semble X, si |) M, = X. Un recouvrement de l’espace topologique 


œ 
T constitué d’ensembles ouverts (fermés) est dit recouvrement ouvert 
(fermé). Si une partie {M4,} du recouvrement {W,} est elle-même 


un recouvrement de l’espace T, on dit que {Mo} est un sous-recou- 
vrement de {M, }. 


Théorème sos. SiTest un espace topologique à base dénombra- 
ble, de tout recouvrement ouvert de T on peut extraire un sous-recouvre- 
ment fini ou dénombrable. 


Démonstration. Soit {O0,} un recouvrement ouvert de 
l'espace T. Alors tout point x € T appartient à un ensemble {O, }. 
Soit, d'autre part, {G,} une base dénombrable de T. Pour tout point 
x € T il existe un élément G, (x) de cette base tel que x € G, (x) 
& O,. La famille d’ensembles G, (x) ainsi choisis est finie ou dénom- 
brable et recouvre tout l’espace T. En choisissant pour chaque 
G, (x) un ensemble O, parmi ceux qui le contiennent, on obtiendra 
bien un sous-recouvrement fini ou dénombrable du recouvrement 
{Ou}. 

Le théorème est démontré. 

Selon la définition d’un espace topologique, l’ensemble vide et 
l'espace T tout entier sont à la fois ouverts et fermés. L'espace qui 
ne contient aucun autre ensemble à la fois ouvert et fermé s'appelle 
espace connexe. La droite numérique R! représente l’un des plus 
simples exemples d'espace connexe. Mais si l’on rejette un ou plu- 
sieurs points de R!, l’espace qui reste n’est plus connexe. 

4. Suites convergentes dans T'. Il est aisé d’étendre aux espaces 
topologiques la notion desuite convergente, bien connue 
pour le cas des espaces métriques. Nous dirons qu’une suite 
Li, Los + + + En, - . . de points de T est convergente vers le point x, 
si tout voisinage du point x contient tous les points de cette suile à 
partir d'un certain rang. Toutefois, dans les espaces topologiques 
la notion de convergence ne joue pas un rôle si important que dans 
les espaces métriques. Cela tient à ce que dans un espace métrique À 
un point x est adhérent à un ensemble M € R si et seulement s’il 
existe dans M une suite convergente vers x, tandis que dans un espace 
topologique il n’en est pas en général de même. Dans un espace 
topologique 7 le fait que x est un point adhérent à l’ensemble A] 
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(c.-à-d. x € (M]) n'entraîne pas l'existence dans M d’une suite con: 
vergente vers x. Considérons, à titre d'exemple, le segment [0, 1] 
et appelons ensembles ouverts tous les sous-ensembles de [0, 1] 
(y compris l’ensemble vide) obtenus en retirant de ce segment un 
nombre fini ou une infinité dénombrable de points. Il est aisé de 
vérifier que les conditions 4° et 2° (p. 78) sont vérifiées, de sorte qu’on 
a bien un espace topologique. Dans cet espace, les seules suites con- 
vergentes sont les suites stationnaires, c.-à-d. celles dont tous les 
termes, à partir d’un certain rang, sont égaux: Zn — Zn+ 4 = : 
(démontrer !). D'autre part, si l’on prend, par exemple, M — (0, 1], | 
le point 0 est adhérent à M (vérifier!) et pourtant aucune suite de 
points de M ne converge dans l’espace considéré vers le point 0. 

Les suites convergentes se trouvent « restituées dans leurs droits », 
si les espaces topologiques considérés ne sont pas arbitraires, mais 
satisfont au premier axiome de dénombrabilité, c.-à-d. si chaque 
point x de l’espace T possède un système fondamental dénombrable 
de voisinages. Dans ce cas, tout point x adhérent à un ensemble 
quelconque M € T peut être interprété comme la limite d’une suite 
de points de M. En effet, soit {O,} un système fondamental dénom- 
brable de voisinages du point x. On peut toujours supposer que 


n 
On+1 € ©, (sinon, on remplacerait O, par f] Oz). Soit x, un point 


quelconque de M, appartenant à O, (k — 1,2,...). Il est clair 
qu'un tel x, existe, car autrement x ne serait pas un point adhérent 
à M. La suite {x,} est évidemment convergente vers x. 

Comme nous l’avons déjà signalé, tous les espaces métriques satis- 
font au premier axiome de dénombrabilité. C’est ce qui nous a permis 
de formuler dans un espace métrique les notions telles que fermeture, 
point adhérent, etc., en termes de convergence de suites. 

9. Applications continues. Homéomorphisme. La notion d’appli- 
cation continue, introduite au $ 1 pour des espaces métriques, peut 
être étendue de façon naturelle aux espaces topologiques arbitraires. 

Définition. Soient X et Ÿ deux espaces topologiques. 
On dit que l’application jf de l’espace X dans l’espace Y est continue 
au point zo, Si pour tout voisinage U,, du point yo = f (to) il existe 
un voisinage V,, du point x, tel que f (V,) € Us L'application 
f: À — YŸ est appelée continue, lorsqu'elle est continue en tout 
point x € À. En particulier, une application continue de l’espace 
topologique X dans la droite numérique s’appelle fonction continue 
sur cel espace. 

On se convainc facilement que pour les espaces métriques cette 
définition coïncide avec celle de la continuité d’une application d'un 
espace métrique dans un autre, donnée au $ 1. 

La définition ci-dessus est de nature « locale ». La continuité de 
l'application f sur tout l’espace X est définie à l’aide de la continuité 
de f en tout point de X. Il se trouve que la notion de continuité de 
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l'application d’un espace topologique dans un autre peut être for- 
mulée en termes d’ensembles ouverts, c.-à-d. en termes de topologie 
de ces espaces. 


Théorème 6. Pour qu'une application f de l'espace topolo- 
gique X dans l'espace topologique Y soit continue, il faut et il suffit que 
l’image réciproque T = f"! (G) de tout ensemble ouvert GE Y soit 
ouverte (dans À). 


Démonstration. La condition est néces- 
saire. Supposons que l'application f soit continue et soit G un 
ensemble ouvert de Y. Démontrons que l’ensemble LV = f-1(G) 
est ouvert. Soit x un point quelconque de Let y = f (x). Alors, G 
est un voisinage du point y. Par la définition de la continuité, il 
existe un voisinage V, du point x tel que f (V,) & G, c.-à-d. V,cT. 
Autrement dit, six € |, il existe un voisinage V, de x contenu dans 
F, ce qui signifie que l'est bien un ensemble ouvert. 

La condition est suffisante. Supposons l — 
— f-1(G) ouvert pour tout ouvert G € Ÿ. Considérons un point 
quelconque x € À et un voisinage quelconque U, du point y — 
= f(x). Puisque y EU,, on a x Ef-!(U,). L'ensemble ouvert 
f"! (U,) est donc un voisinage du point x dont l’image est contenue 
dans U;. 

Le théorème est démontré. 

Remarque. Soient X et Ÿ deux ensembles quelconques et / 
une application de X dans Y. Si l’on définit sur Ÿ une topologie + 
(c.-à-d. une famille d’ensembles, contenant @ et Y et close pour 
toute réunion et pour toute intersection finie d’ensembles), alors 
l'image réciproque de cette topologie t (c.-à-d. la famille de tous 
les ensembles f”! (G), où G € x) est une topologie de X. 

Pour la démonstration il suffit de se rappeler les théorèmes sur 
l’image réciproque d’une réunion et d’une intersection d’ensembles 
(cf. $ 2 chap. I). Nous désignerons cette topologie par f-! (rt). Si 
maintenant À et Ÿ sont des espaces topologiques avec T. et t, comme 
topologies, le théorème 6 peut être formulé comme suit : l’application 
f: À — Ÿ est continue si et seulement si la topologie +, est plus forte 
que la topologie f”? (x,). 

Du fait que l’image réciproque du complémentaire est égale au 
complémentaire de l’image réciproque on déduit le théorème sui- 
vant, dual du théorème 6. 


Théorème 6’. Pour qu'une application f d'un espace topolo- 
gique À dans un espace topologique Y soit continue, il faut et il suffit 
que l’image réciproque de tout ensemble fermé de Y soit un ensemble 
fermé (dans X). 


On vérifie facilement que l’image d’un ensemble ouvert (fermé) 
par une application continue n’est pas nécessairement ouvert (fer- 
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mé). Considérons, par exemple, une application continue de l'inter- 
valle semi-ouvert [0, 4) sur une circonférence. L'ensemble [*/», 1), 
fermé dans [0, 4), a pour image sur la circonférence un ensemble 
non fermé (fig. 11). 

Pour les applications continues on a le théorème suivant, analo- 
gue au théorème bien connu de l'analyse sur la continuité d’une 
fonction composée. 


Théorème 7. Soient X, Ÿ et Z trois espaces topologiques. 
Si les applications f: X —+ YŸ et p: Y — Z sont continues, l'application 
z— œ(f(x)) de X dans Z est aussi 


continue. f(0) 
La démonstration de ce théo- 

rème s'obtient immédiatement du MAMAN 

théorème 6. 4) 1/2 1 


La notion d’homéomorphisme, 
introduite au $ 1 pour les espa- 
ces métriques,.s’étend aux espaces Fig. 11 
topologiques. À savoir, l’applica- 
tion f d’un espace topologique À dans un espace topologique Y 
s'appelle homéomorphisme, lorsqu'elle est biunivoque et bicon- 
tinue : les espaces X et Ÿ sont dits alors espaces homéomorphes. Deux 
espaces homéomorphes possèdent les mêmes propriétés topologiques 
et, du point de vue topologique, peuvent être considérés simplement 
comme deux exemplaires du même espace. Les topologies de deux 
espaces homéomorphes représentent l’image et l’image réciproque 
l’une de l’autre. La relation d’homéomorphisme est réflexive, symé- 
trique et transitive ; par conséquent, tout ensemble d'espaces topolo- 
giques se trouve divisé en classes disjointes d'espaces homéomorphes 
entre eux. 

Remarque. Il importe de noter que les propriétés métri- 
ques de deux espaces métriques homéomorphes peuvent être 
différentes !). Par exemple, l’un d’eux peut être complet sans que 


l’autre lesoit. Ainsi, l'intervalle — _ 5 


numérique (l’homéomorphisme peut être donné, par exemple, à 
l’aide de la fonction x —+ tg x); or, la droite numérique est un espace 
complet, tandis que l'intervalle ne l’est pas. 

6. Axiomes de séparation. Bien que de nombreuses notions 
fondamentales des espaces métriques s'étendent sans difficulté aux 
espaces topologiques arbitraires, ces derniers représentent tout de 
même un objet trop général du point de vue des problèmes de l’ana- 


f(f2) 


| est homéomorphe à la droite 


1) La métrique d’un espace À définit de façon unique sa topologie, mais la 
réciproque n'est pas vraie: la même topologie de l’espace R — (X, p) peut être 
obtenue à l’aide des métriques différentes, définies sur X. 
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lyse. Dans ces espaces on rencontre souvent des situations essentielle- 
ment différentes de celles qui peuvent apparaître dans les espaces 
métriques. Ainsi, nous avons vu que dans un espace topologique 
un ensemble fini de points peut ne pas être fermé (exemple 4, p. 79), 
etc. 

Parmi les espaces topologiques on peut distinguer des espaces 
qui par leurs propriétés sont plus proches des espaces métriques. 
Pour cela il faut ajouter aux axiomes 1° et 2° de l’espace topologique 
(p. 78) certaines conditions supplémentaires. C’est le cas, parexemple 
des axiomes de dénombrabilité ; ils permettent d'étudier la topolo- 
gie d’un espace en partant de la notion de convergence. Un autre 
type important de conditions supplémentaires est fourni par les 
conditions d’une autre nature, nommées axiomes de séparation. Nous 
énumérerons ci-après les axiomes de cette série dans l’ordre de leur 
renforcement successif. 

Azxiome T, (premier axiome de séparation) : quels que soient deux 
points distincts x et y de l’espace T7, il existe un voisinage O, du 
point x, ne contenant pas y, et un voisinage O, du point y, ne conte- 
nant pas x. 

Les espaces satisfaisant à cet axiome s'appellent T',-espaces. 
Un exemple d’espace topologique qui n’est pas T;-espace est fourni 
par le couple de points connexe. 

Dans un T',-espace tout singleton est un ensemble fermé. En effet, 
si + Æ y, il existe un voisinage O, du point y, ne contenant pas x, 
c.-à-d. y él{x}l. De ce fait, [{x}] — {x}. Par conséquent, dans un 
T;-espace tout ensemble fini de points est également fermé. De plus, 
on vérifie sans peine que l’axiome 7, équivaut exactement à la 
condition que tous les ensembles de cette sorte soient fermés. 

Plus haut (cf. p. 79) nous avons appelé point d’accumulation 
d’un ensemble M de l’espace topologique T tout point x € T tel que 
UNMX {x} ©, U étant un voisinage arbitraire du point x. 

Dans des espaces ne satisfaisant pas à l’axiome 7,, même un 
ensemble fini peut avoir des points d’accumulation. En effet, soit, 
par exemple, 7 un couple de points connexe dont la topologie est 
formée par les ensembles @, {b} et {a, b}. Alors le point a est un 
point d’accumulation de l’ensemble M = {b}. 

Dans les T,-espaces un tel phénomène est impossible. Plus préci- 
sément, on a la proposition suivante. 


Lemme. Pour que le point x soit un point d'accumulation de 
l’ensemble M d’un T,-espace, il faut et il suffit que tout voisinage U 
de ce point contienne une infinité de points de M. 


Il est évident que cette condition est suffisante. Démontrons 
qu’elle est nécessaire. Soit x un point d’accumulation de M ; suppo- 
sons qu'il existe un voisinage U du point x ne contenant qu’un nom- 
bre fini de points de M. Soient x, Ze, . . ., ïn tous ces points, excepté 
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le point x (s’il appartient à M). Alors, V = U NX {x,...,x,} 
est un voisinage de x et VA MX {x} = @. 

Tout espace métrique est manifestement un T;,-espace. C’est 
pourquoi dans un espace métrique la notion de point d’accumulation 
d’un ensemble a été introduite en partant de la propriété indiquée 
dans le lemme ci-dessus. 

L’axiome suivant est un renforcement du premier axiome de 
séparation. 

Azxiome T, (deuxième axiome de séparation ou axiome de Hausdorff) : 
quels que soient deux points distincts x et y d’un espace topologique 
T, il existe deux voisinages O, et O, disjoints. 

Les espaces satisfaisant à cet axiome s’appellent T.-espaces ou 
espaces de Hausdorff. Tout espace de Hausdorff est un T;-espace, 
mais pas inversement. Un exemple de T,-espace qui n’est pas un 
espace de Hausdorff est fourni par le segment [0, 1] dont la topolo- 
gie est formée par l’ensemble vide et tous les ensembles obtenus de 
ce segment en rejetant un nombre fini ou une infinité dénombrable 
de points. 

Azxiome T, (troisième axiome de séparation) : tout point et tout en- 
semble fermé ne contenant pas ce point possèdent des voisinages dis- 
joints. Notons que dans un espace topologique T on appelle voisinage: 
d'un ensemble M tout ensemble ouvert ÜU contenant M. 

Cet axiome peut être énoncé sous la forme équivalente suivante : 

Pour tout voisinage U d’un point quelconque x il existe un voi- 
sinage plus petit de ce point, contenu dans Ü avec sa fermeture. 

Le lecteur pourra démontrer cela à titre d'exercice. 

Puisque dans un espace topologique arbitraire un ensemble d’un 
seul point peut ne pas être fermé, le troisième axiome de séparation 
présente de l’intérêt seulement pour les espaces satisfaisant à l’axio- 
me 7,. Les espaces satisfaisant aux deux axiomes T, et T, à la fois: 
sont appelés espaces réguliers. 

Tout espace régulier est évidemment un espace de Hausdorff. 
On obtiendra un exemple d'espace de Hausdorff non régulier, en 
considérant le segment [0, 1], où les voisinages de tous les points, 
excepté 0, sont définis comme d'ordinaire, tandis que le point 0 
admet pour voisinages tous les intervalles semi-ouverts [0, æ), d’où 


l’on a retiré les points du type - (n —= 1, 2, ...). C’est bien un espa- 
ce de Hausdorff non régulier, car le point Oetlasuite {2} qui est un 


ensemble fermé ne contenant pas 0, n’a pas de voisinages disjoints. 

En analyse on n’a pas d'habitude affaire à des espaces plus géné- 
raux que les espaces réguliers. Bien au contraire, les espaces les plus 
intéressants du point de vue de l’analyse satisfont encore à la con- 
dition plus forte suivante, nommée condition de normalité 
de l’espace. 
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Azxiome T, (axiome de normalité) : un T,-espace est dit espace nor- 
mal, si pour n'importe quels deux ensembles fermés disjoints de cet 
espace il existe des voisinages disjoints. 

En particulier, tous les espaces métriques sont normaux. En effet, 
soient X et Y deux ensembles fermés disjoints de l’espace métrique À. 
Tout point x € À possède un voisinage O, qui ne rencontre pas Ÿ ; 
par conséquent, il se trouve à une distance positive p. de Ÿ. De même, 
la distance de tout point y € Y à l’ensemble X est un nombre positif 
°,. Considérons les ensembles ouverts !) 


_ Pa — Êv 
U= VB (x, : ) et V— UE (y. ; | 

contenant respectivement X et Ÿ et montrons que leur intersection 
est vide. Supposons qu'il existe un point z € ÜU f] V. Alors il existe 
dans X un point x, tel que p (xo, z) << 0, /2 et dans Ÿ un point yo 
tel que p (2, yo) < Py/2. Soit, par exemple, p,, < Py+ On a alors 


Pr p 
P (To; Yo) LP (Lo; z)+-0 (2, Yo) < + < Oyos 


©.-à-d. zo € B (Yo, Pyo)- Comme cela contredit la définition de p,,, 
notre affirmation est démontrée. 

Tout sous-espace d’un espace métrique, étant lui-même un espace 
métrique, possède toujours la propriété d’être normal. Il n’en est pas 
en général de même, lorsqu'il s’agit des espaces normaux arbitrai- 
res: un sous-espace d’un espace normal n'est pas forcément un espa- 
<e normal. Autrement dit, la normalité des espaces n’est pas une pro- 
priété héréditaire ?). 

Un exemple de propriété héréditaire est fourni par la régularité 
complète des espaces topologiques qui constitue un renforcement de 
la propriété de régularité. Un T;,-espace topologique est appelé 
complètement régulier, si pour tout ensemble fermé F € T' et pour tout 
point x0E€ T  X F il existe une fonction réelle f, continue sur 7, 
nulle en x, égale à 1 sur F et vérifiant la condition 0 £ f (x) < 1. 
Tout espace normal est complètement régulier ?), mais pas récipro- 
quement. Tout sous-espace d’un espace complètement régulier (éven- 
tuellement, normal) est aussi complètement régulier. La notion d’es- 
pace complètement régulier est due à A. Tikhonov qui a montré 
par ailleurs que la classe des espaces complètement réguliers coïncide 


1) Ici B (x, r) est, comme d'habitude, une boule ouverte de rayon r et de 
ceutre zx. 

2) Une propriété P est dite héréditaire, si du fait qu’un espace topologique T 
Ja possède Î résulte que tous les sous-espaces de 7 la possèdent également. 

3) Ce fait (nullement évident) est une conséquence du théorème suivant, 
dû à P.S. Urysohn: si T est un espace normal et F;, F, sont deux sous-ensembles 
fermés disjoints de 7, il existe une fonction f continue sur 7, vérifiant la condi- 
tion 0 < f (x) < 1, nulle sur F, et égale à 1 sur F2. 
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avec la classe de tous les sous-espaces des espaces normaux. Du point 
de vue de | analyse les espaces complètement réguliers sont importants 
grâce au fait que sur un tel espace il y a des fonctions continues « en 
quantité suffisamment grande », plus précisément, grâce à la pro- 
priété suivante: quels que soient les points distincts x et y d’un 
espace complètement régulier 7, il existe une fonction réelle f, défi- 
nie et continue sur 7, telle que f (x)  f (y). 

7. Différentes méthodes de définition de la topologie sur un espace. 
Métrisabilité. La méthode la plus directe pour définir la topologie 
d'un espace consiste à indiquer tout simplement les ensembles qu'il 
convient de considérer comme ouverts. Ces ensembles doivent satis- 
faire évidemment aux conditions 1° et 2° (page 78). Une méthode 
équivalente à celle-ci est sa duale qui consiste à indiquer une famille 
d’ensembles fermés, vérifiant les conditions 1 et 2 (page 79). Mais 
en réalité, cette méthode est peu pratique. Ainsi, par exemple, même 
dans le cas du plan il est pratiquement impossible de donner une des- 
cription directe detous les sous-ensembles ouverts (comme on par- 
vient à le faire dans le cas de la droite (cf. théorème 5, $ 2)). 

Une méthode courante de définition de la topologie consiste à 
choisir une base ; en fait, c’est justement de cette façon qu’on intro- 
duit la topologie dans un espace métrique, où à partir de la métri- 
que donnée on choisit comme base l’ensemble des boules ouvertes. 

Une autre méthode possible de définition de la topologie sur un 
espace consiste à introduire dans cet espace la notion de convergence. 
Mais au-delà des espaces métriques cette méthode n’est pas toujours 
commode, étant donné que le passage d’un ensemble à sa fermeture, 
comme on l’a déjà signalé au n° 4, ne peut pas être toujours exprimé 
en termes de suites convergentes. Cette méthode peut être rendue 
universelle, en généralisant convenablement la notion même de suite 
convergente (cf. par exemple, [29], chap. 2). 

Il est possible d'introduire la topologie dans un espace, en défi- 
nissant axiomatiquement l'opération de fermeture. On dit que dans 
un ensemble X on a défini l’opération de fermeture, si à tout ensemble 
A X on a fait correspondre un ensemble [AJ X, dit fermeture 
de À, de façon que le passage de À à [A] possède les propriétés 1)-4), 
indiquées dans l'énoncé du théorème 1, $ 2. En définissant par la 
suite les ensembles fermés comme ensembles jouissant de la propriété 
[A] — À, on voit aisément que cette classe d’ensembles vérifie les 
conditions 1 et 2 (page 78) et, par conséquent, définit bien une topo- 
logie sur X. 

La donnée d’une métrique offre l’une des plus importantes métho- 
des de définition de la topologie d’un espace, bien que cette méthode 
soit loin d’être universelle. Comme nous l’avons déjà vu, tout espace 
métrique est normal et satisfait au premier axiome de dénombrabi- 
lité. Dans un espace dépourvu de l’une au moins de ces deux proprié- 
tés il est impossible de définir la topologie à l’aide d’une métrique. 
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Définition. Un espace topologique T, est dit métrisable, 
si sa topologie peut être définie à l’aide d’une métrique. 

En vertu de ce qui vient d’être dit, la normalité et le premier axio- 
me de dénombrabilité sont les conditions nécessaires de 
métrisabilité d’un espace. D'autre part, ni chacune de ces conditions 
prises à part, ni même les deux à la fois,ne sont suffisan- 
tes pour que l’espace soit métrisable. On a pourtant le théorème 
suivant, dû à P. S. Urysohn: 

Pour qu'un espace topologique à base dénombrable soit métrisable, 
il faut et il suffit que cet espace soit normal. 

Il est clair que cette condition est nécessaire. On trouvera une 
démonstration du fait, qu’elle est suffisante, par exemple, dans [2]. 


$ 6. Compacité 


1. Notion de compacité. Un rôle fondamental en analyse est 
joué par la proposition suivante, connue sous le nom du lemme de 
Heine-Borel : 

De tout recouvrement d'un segment la, b] de la droite numérique 
par des intervalles on peut extraire un sous-recouvrement fini. 

Cette proposition reste vraie, si l’on remplace Îles intervalles par 
des ensembles ouverts arbitraires : «de tout recouvrement ouvert du seg- 
ment (a, b] on peut extraire un sous-recouvrement fini. 

En partant de cette propriété des segments de la droite numéri- 
que, on introduit la notion importante suivante. 

Définition. Un espace topologique T est appelé espace 
compact, si tout recouvrement ouvert de T contient un sous- 
recouvrement fini. 

Un compact est un espace topologique compact qui satisfait à: 
l’axiome de séparation de Hausdorff. 

Nous verrons plus tard que la compacité est une propriété dont 
jouissent non seulement les segments, mais aussi tous les sous-ensem- 
bles fermés et bornés de tout espace euclidien de dimension finie. 
Par contre, la droite, le plan, l’espace à trois dimensions représen- 
tent les plus simples exemples d'espaces non compacts. 

Nous dirons qu’une famille de parties {A} d'un ensemble T est 


n 
centrée, si aucune intersection finie A; d’ensembles de cette famil- 
i=1 


le n’est vide. De la définition des espaces compacts, à l’aide des rela- 
tions de dualité, on déduit le théorème suivant. 


Théorème 1. Pour qu'un espace topologique T soit compact, il 
faut et il suffit qu'il vérifie la condition : 


(R) toute famille centrée de sous-ensembles fermés de T admet une 
intersection non vide. 
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En effet, soit {F,} une famille centrée de sous-ensembles fermés 
de T et soit T un espace compact. Les ensembles G, = TX F, 


nr 
sont ouverts et comme aucune intersection finie f]#; n’est vide, on 


1—= 
en déduit qu'aucune famille d’ensembles G; — T X F; ne recouvre T 
entièrement. Mais alors (en vertu de la compacité de T) l’ensemble 
de tous les G, ne peut pas constituer un recouvrement de T', ce qui 
signifie que fF, == @. Ainsi donc, si T est un espace compact, il 
remplit la condition (R). 

Réciproquement, supposons que T7 vérifie la condition (AR) et 
soit {G,} un recouvrement ouvert de T. En posant F, = T\ G, 
on obtient NF, — @, d’où l’on déduit (en vertu de la condition (R)) 
que la famille {F, } ne peut pas être centrée. Il existe donc des ensem- 


n 
bles F,, ..., F,, tels que NF; — @. Mais alors les ouverts corres- 
i=1 


pondants G; = T X F; forment un sous-recouvrement fini du recou- 
vrement {G,}. Donc, la condition (R) est équivalente à la compacité. 

Nous allons établir maintenant quelques propriétés importantes 
des espaces compacts. 


Théorème 2. Si T est un espace compact, tout sous-ensemble 
infini de T possède au moins un point d'accumulation. 


Démonstration. Si Z contient un ensemble infini X 
ne possédant aucun point d’accumulation, alors de X on peut extrai- 
re un sous-ensemble dénombrable 


X1 = (x; Toy + +), 


ne possédant non plus aucun point d’accumulation. Mais alors les 
ensembles 
Xn—=(Zn, Ln+1s . .…) 


forment une famille centrée de sous-ensembles fermés de 7 dont l’in- 
Lersection est vide, ce qui signifie que TZ n’est pas compact. 


Théorème 3. Tout sous-ensemble fermé d'un espace compact 
est un espace compact. 


Démonstration. Soit F un sous-ensemble fermé de l’es- 
pace compact T et soit {F,} une famille centrée quelconque de sous- 
ensembles fermés du sous-espace F € T. Comme tout ensemble F, 
fermé dans F, est aussi fermé dans T, {F,} est une famille centrée 
de sous-ensembles fermés de T. Par conséquent, NF, = @. En vertu 
du théorème 1 on en déduit la compacité de F. 

Etant donné que tout sous-espace d’un espace de Hausdorîff est 
lui-même un espace de Hausdorff, on obtient : 

GCorollaire. Tout sous-ensemble fermé d'un compact est un 
compact. 
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Théorème 4. Un compact est fermé dans tout espace de Haus- 
dorff qui le contient. 


Démonstration. Soit À un sous-ensemble compact d’un 
espace de Hausdorîff T et soit y 6 ÆX. Alors, quel que soit x € K, il 
existe un voisinage U, du point x et un voisinage V, du point y tels. 
que 
Les voisinages U, forment un recouvrement ouvert de ÆX. En vertu. 
de la compacité de ÆÀ on peut en extraire un sous-recouvrement fini 
Ury, Uxos + + +, Uxne Posons 


V= Vif Vol ce 1 Vans 


Alors V est un voisinage du point y qui ne rencontre pas U,, U U,, U 
U...U U;x, = X. Par conséquent, y é [IX], ce qui signifie que X 
est fermé. 

Le théorème est démontré. 

Les théorèmes 3 et 4 montrent que dans la classe des espaces de 
Hausdorff la compacité est une propriété intrinsèque, c.-à-d. que tout 
compact reste un compact, quel que soit l’espace de Hausdorff plus 
large qui le contient. 


Théorème 5. Tout compact est un espace normal. 


Démonstration. Soient À et YŸ deux sous-ensembles 
fermés disjoints d’un compact X. En appliquant les mêmes raisonne- 
ments que dans la démonstration du théorème précédent, il est aisé 
de voir que pour tout point y € Ÿ il existe un voisinage U, de yet un 
ensemble ouvert 0, X tels que U,,f O0, — @. On en déduit que 
tout compact est un espace régulier. Supposons maintenant que y 
parcoure tout l’ensemble Y. Considérons un sous-recouvrement fini 
Uyus : + + Uyn du recouvrement {U/,} de l’ensemble Y. Les ensembles 
ouverts 


1 2 
ON =O NN... NOm et OP=ULU.. UUm 
vérifient les conditions 
O3 X, O®35Y, 0 NAOË = G, 
d’où la normalité de X. 
2. Applications continues des espaces compacts. Les applications 


continues des espaces compacts, en particulier, des compacts, pos- 
sèdent des propriétés aussi intéressantes qu'importantes. 


Théorème 6. L'image d'un espace compact dans une appli- 
cation continue est un espace compact. 


Démonstration. Soit Ÿ un espace compact et f une ap- 
plication continue de X dans un espace topologique Ÿ. Considérons 
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un recouvrement quelconque {V,} de son image f (X) par des ensem- 
bles ouverts dans f (X). Posons U, = f! (V,). Les ensembles U, 
sont ouverts (comme images réciproques d’ensembles ouverts dans 
une application continue) et constituent un recouvrement de l’espace 
X. En vertu de la compacité de À, de ce recouvrement on peut ex- 
traire un sous-recouvrement fini U;,, Uo, . .., U,. Alors les ensem- 
bles V;, Vo, . .., V,, où V, — f (U;), recouvrent l’image jf (X) de 
l’espace X. 


Théorème 7. Toute application biunivoque et continue œ 
d'un compact X sur un espace de Hausdorff Y est un homéomorphisme. 


Démonstration. Il suffit de montrer que les conditions 
du théorème entraînent la continuité de l’application réciproque ®"{. 
Soient F un ensemble fermé dans X et P = œ (F) son image dans Y. 
D'après le théorème précédent P est un compact et, par conséquent, 
P est fermé dans Ÿ. Donc, l’image réciproque de tout ensemble fermé 
FE X dans l'application ®-! est fermée. D'où la continuité de l’ap- 
plication "1. 

3. Fonctions continues et semi-continues définies sur un espace 
compact. Au numéro précédent il a été question des applications 
continues d’un compact dans un espace de Hausdorff. Un cas parti- 
culier des applications de ce type est constitué par les applications 
d’un compact dans la droite numérique, c.-à-d. par les fonctions numé- 
riques définies sur un compact. Ces fonctions possèdent les propriétés 
principales des fonctions définies sur un segment, connues du cours 


d'analyse. 


Théorème 8. Soient T un espace compact et f une fonction con- 
tinue sur T. Alors f est bornée sur T et y atteint sa borne supérieure et sa 
borne inférieure. 


Démonstration. Une fonction continue est une applica- 
tion continue de 7 dans la droite numérique R!. En vertu du théo- 
rème général 6, l’image de 7 dans R! est un ensemble compact. Or, 
du cours d’analyse (cf. aussi n° 2, $ 7) on sait que tout sous-ensemble 
compact de la droite numérique est fermé et borné. Un tel ensemble 
non seulement admet une borne supérieure et une borne inférieure 
finies, mais aussi il les contient. 

Le théorème est démontré. 


Exercice. Soit À un espace métrique compact et soit À une application 
de À dans lui-même, telle que p (4x, Ay) << p (x, y) pour x & y. Montrer que 
l’application À possède dans À un point fixe et un seul. 

L’affirmation du dernier théorème admet une extension à une classe plus 
large de fonctions, nommées fonctions semi-continues. 

Une fonction f (x) est dite semi-continue inférieurement (resp. supérieurement) 
en un point x,, si pour tout € >> Oil existe un voisinage U de x,, tel que si x € U, 
on à f(x) > f(xo) — & (respectivement, f (x)  f (xo) + €). 
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Par exemple, la fonction « partie entière de x », f (x) = £ (x) est semi-conti- 
nue supérieurement. Lorsqu'on augmente (ou diminue) la valeur f (x;) d’une 
fonction continue en un point quelconque x, on obtient une fonction semi-conti- 
nue supérieurement (inférieurement). Si la fonction f (x) est semi-continue supé- 
rieurement, la fonction — f (x) est semi-continue inférieurement. Ces deux re- 
marques donnent la possibilité de construire un grand nombre d’exemples de 
fonctions semi-continues. 

Pour étudier les propriétés de la semi-continuité des fonctions réelles, il est 
commode de convenir qu'elles peuvent prendre des valeurs infinies. Si f (xo) — 
— — oo Ja fonction / sera considérée comme semi-continue inférieurement au 
point x, ; si en outre, pour tout k = 0 il existe un voisinage U de x, tel que 
f (x) << — h pour tout x € U, on dira aussi que f est semi-continue supéricure- 
ment au point to. . 

Si f (xo) = + oc, la fonction f sera considérée comme semi-continue supé- 
rieurement au point x, ; si, en outre, pour tout À = 0 il existe un voisinage U de 
x tel que f (x) > h pour tout x € U, on dira aussi que cette fonction est semi- 
continue inférieurement au point ro. 

Soit f (x) une fonction réelle définie sur un espace métrique R. On appelle 
limite supérieure f (x) de la fonction f (x) au point x, la quantité (finie ou infinie) 
lim[ sup f(x)l. On définit la limite inférieure f (xs) de manière analogue, 
£=0 xéB (xo, €) — 
en remplaçant la borne supérieure par la borne inférieure. La différence of (xo) = 
= f (xo) — f (x) (lorsqu'elle a un sens, c.-à-d. lorsque f (x) et f(xo) ne sont pas 
infinis et de même signe) est appelée oscillation de la fonction f (x) au point x. 
Il est aisé de voir que pour la continuité de la fonction f (x) au point x, il faut 
et il suffit que of (xo) = 0 c.-à-d. que — © < f (xo) = f (to) << ©. 

Quelle que soit la fonction f (x), définie sur un espace métrique, la fonction 
f (x) est semi-continue supérieurement et la fonction f (x) est semi-continue infé- 
rieurement. Ceci résulte immédiatement de la définition des limites supérieure 
et inférieure. 

Considérons l’espace métrique M ayant pour éléments x toutes les fonctions 
réelles bornées œ (t), définies sur le segment [a, b], la métrique étant définie par 
l'égalité 

p(z, y)=p(?, p)= sup |p(G)—1 (6). 
a<t<b 


Les fonctions définies sur M seront appelées, comme c’est l’usage, fonctionnel- 
les, pour les distinguer des fonctions œ (ft), éléments de M. 
Considérons un exemple important de fonctionnelle semi-continue. 
Appelons longueur de la courbe y = f (x) (a < x < b) la fonctionnelle 


n 
LÉ (P=sup D Vi-zi 1) +0 (x) Gi 1), 
i—=1 
où la borne supérieure (qui peut être égale à co) est prise sur l’ensemble de 
toutes les subdivisions possibles du segment [a, b]. Cette fonctionnelle est défi- 
nie sur tout l’espace M. Pour des fonctions continues elle coïncide avec la valeur 


de la limite 
n 


lim D Vic) + Gin (Gi). 


Enfin, pour des fonctions continûment dérivables elle peut s’écrire sous la forme 
b 


| VIZLF2(x) dx. 


a 
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La fonctionnelle LP (f) est semi-continue inférieurement dans M, ce qui 
résulte immédiatement de sa définition. 
Le théorème 9, démontré plus haut, s’étend aux fonctions semi-continues. 


Théorème 8a. Toute fonction finie et semi-continue inférieurement 
(resp. supérieurement) sur un T;-espace compact T est bornée inférieurement (resp. 
supérieurement) sur T. 


En effet, supposons que inf f (x) = — co. Il existe alors une suite {x, } telle 
que f(x,) < — n. Comme l’espace T est compact, son sous-ensemble infini 
{x,} possède (d’après le théorème 2) au moins un point d’accumulation x,. La 
fonction f étant par hypothèse finie et semi-continue inférieurement, il existe 
un voisinage U de x, tel que f (x) =>"'f (to) — 1, si x € U. Mais alors le voisi- 
nage U ne peut contenir qu’un nombre fini de points de l’ensemble {xr, }, ce qui 
contredit le fait que x, est un point d’accumulation de cet ensemble. 

Pour le cas d’une fonction semi-continue supérieurement la démonstration 
est analogue. 


Théorème 8b. Toute fonction finie et semi-continue inférieurement (resp. 
supérieurement) sur un T;-espace compact T atteint sur T sa borne inférieure (resp. 
supérieure). 


Soit f (x) une fonction semi-continue inférieurement. D’après le théorème 8a 
elle admet une borne inférieure finie et il existe dans 7 une suite {x, } telle que 


f (an) int f (9 + Z. 


Comme l’espace T est compact, l’ensemble {x, } possède un point d’accumu- 
lation x,. On ne peut pas avoir f(x) > inf f, car alors, étant donné que la fonc- 
tion f est semi-continue inférieurement, il existerait un voisinage U du point 
x, et un nombre 6 > 0 tels que f (x) > inf f + à pour tout x € U. Mais un tel 
voisinage U ne pourrait pas contenir un sous-ensemble infini de {x,}. Donc, 
f (&o) = inf f, ce qu'il fallait démontrer. 


4. Compacité dénombrable. Introduisons la notion suivante. 

Définition. On dit qu'un espace T est dénombrablement 
compact, si tout sous-ensemble infini de 7 admet au moins un point 
d’accumulation. 

Du théorème 2, démontré au n° 1, il résulte que tout espace com- 
pact est dénombrablement compact. La réciproque n’est pas en géné- 
ral vraie. Voici un exemple « traditionnel » d'espace dénombrable- 
ment compact qui n’est pas compact. Considérons l’ensemble X 
de tous les nombres ordinaux & inférieurs au premier nombre ordinal 
non dénombrable w,. Appelons un intervalle (x, 6) dans X 
l'ensemble de tous les nombres ordinaux y tels que à < y < f. 
Appelons ensemble ouvert dans X toute réunion d’inter- 
valles. Il est aisé de vérifier que l’espace ainsi construit est dénombra- 
blement compact, mais non compact. 

Le rapport entre la notion de compacité et celle de compacité 
dénombrable sera éclairci par le théorème suivant. 


Théorème 9. Pour qu'un espace topologique T soit dénombra- 
blement compact, il faut et il suffit que l’une quelconque des con- 
ditions suivantes soit remplie : 


7—0167 
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1) Tout recouvrement ouvert dénombrable de l'espace T contient 
un sous-recouvrement fini. 

2) Toute famille centrée dénombrable d’ensembles fermés dans T 
possède une intersection non vide. 


Démonstration. L’équivalence des conditions 1) et 2} 
est une conséquence immédiate des relations de dualité. Si l’espace T 
n’est pas dénombrablement compact, alors en reprenant le raisonne- 
ment utilisé à la démonstration du théorème 2, il est aisé de voir que 
dans T il existe une famille centrée dénombrable d’ensembles fermés 
dont l’intersection est vide. Ceci prouve que la condition 2) (et donc, 
la condition 1) également) est suffisante. Montrons maintenant que la 
condition 2) est nécessaire. Supposons l’espace T dénombrablement 
compact et soit {F,} une famille centrée dénombrable d’ensembles 
fermés dans T. Il s’agit de montrer que f F, = @. Posons 

ñn 


D, — N Fr. 
R=1 


Il est clair que tous les ensembles ®, sont fermés, non vides (puisque 
la famille {F,} est centrée), qu’ils forment une suite non croissante 


D,>= D, 3... 


et que 
N D,, — N F;. 
ñn ñn 


Deux cas sont possibles : 
1) À partir d’un certain numéro ñn9, On a: 


Daho = Paot1 == +. 
Dans ce cas il est évident que ND, = D,, Æ S. 
n 
2) Parmi les ®, il y a une infinité d’ensembles deux à deux dis- 


tincts. Il suffit de considérer le cas, où tous les D, diffèrent l’un de 
l’autre. Soit 


Tn € Dh N Dh. 


La suite {x,} constitue un ensemble infini de points distincts de T ; 

en vertu de la compacité dénombrable de T, elle possède au moins un 

point d’accumulation, soit x,. Or, comme ®, contient tous les points 

LTns Tnt + + +, alors x, est également un point d'accumulation de D, 

et comme ®, est fermé, xo € D®,. Par conséquent, ND, 3 xs, c.-à-d. 
n 


ñn 
Ainsi donc, les espaces compacts comme les espaces dénombrable- 
ment compacts sont caractérisés par le « comportement » de leurs 
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recouvrements ouverts. Et dans un cas et dans l’autre d’un recouvre- 
ment ouvert on peut extraire un recouvrement fini, mais dans le pre- 
mier Cas il s’agit des recouvrements arbitraires, tandis que dans le 
deuxième cas il ne s’agit que des recouvrements dénombrables. 

Bien qu’en général la compacité dénombrable n'implique pas la 
compacité, on a le théorème suivant. 


Théorème. 10. Dans le cas des espaces à base dénombrable il y 
a identité entre la notion de compacité et celle de compacité dénombrable. 


En effet, quel que soit le recouvrement ouvert d’un espace T 
à base dénombrable, on peut en extraire un sous-recouvrement dé- 
nombrable (cf. théorème 5, $ 5). Si, en outre, T est dénombrable- 
ment compact, de ce dernier on peut extraire, d’après le théorème 
précédent, un sous-recouvrement fini. On en déduit que l’espace T 
est alors compact. 

Remarque. La notion de compacité dénombrable d’un espace 
topologique s’est avérée en réalité peu naturelle et moins réussie que 
celle de compacité. Elle est apparue, pour ainsi dire, « par inertie ». 
Cela tient à ce que pour les espaces métriques (comme pour les espaces 
à base dénombrable) ces deux notions coïncident (ce fait sera dé- 
montré au paragraphe suivant). D'autre part, pour les espaces mé- 
triques la notion de compacité fut primitivement introduite juste- 
ment pour exprimer la propriété que tout sous-ensemble infini d’un 
tel espace possède un point d’accumulation, c.-à-d. comme la notion 
de compacité dénombrable. C’est l'extension « automatique » de 
cette définition du cas d’un espace métrique à celui d’un espace topo- 
logique qui conduisit à la notion d’espace topologique dénombrable- 
ment compact. Dans les ouvrages mathématiques, surtout dans les 
livres plus ou moins vieux, le terme « compacité » est souvent utilisé 
au sens de « compacité dénombrable », tandis que les espaces topolo- 
oiques, compacts conformément à notre terminologie, c.-à-d. les 
espaces dont tout recouvrement ouvert contient un recouvrement 
fini, sont appelés espaces bicompacts. De même, les espaces compacts 
de Hausdorff (c.-à-d. les compacts) sont appelés bicompacts, le terme 
« compact » étant réservé pour désigner un espace métrique 
compact. Nous allons nous servir des termes introduits plus haut 
(compacité, compacité dénombrable) ; en outre, nous appellerons les 
espaces métriques compacts aussi compacts ou, lorsqu'il est 
nécessaire de souligner spécialement la présence de la métrique, 
« compacts métriques ». 

5. Ensembles précompacts. Si un ensemble 4, inclus dans un 
espace de Hausdorff T, n’est pas fermé dans T, il ne peut pas être 
compact. Par exemple, aucun sous-ensemble non fermé de la droite 
numérique n’est compact. Pourtant, il est possible que la fermeture 
[A1] d'un tel ensemble M dans T possède la propriété de compacité. 
Il en est ainsi, par exemple, de tout sous-ensemble borné de la 


7* 


400 ESPACES MÉTRIQUES ET TOPOLOGIQUES [Ch. II 


D! 


droite numérique ou d’un espace à x dimensions. On est conduit à 
la définition suivante. 

Définition. Un ensemble M, inclus dans un espace topolo- 
gique 7, est dit précompact (ou compact par rapport à T), si sa fer- 
meture dans T est compacte. De manière analogue, un ensemble À 
est dit dénombrablement précompact dans T, si tout sous-ensemble 
infini À € M admet au moins un point d’accumulation (qui peut 
appartenir ou non à l’ensemble 7). 

La notion de précompacité (contrairement à celle de compacité) 
est évidemment liée à l’espace T, dans lequel nous plongeons l’en- 
semble donné. Par exemple, l’ensemble des points rationnels de l’in- 
tervalle (0, 1) est précompact, s’il est considéré comme sous-ensem- 
ble de la droite numérique, mais il n’est pas précompact, si on le consi- 
dère comme sous-ensemble de.l’espace des nombres rationnéls. 

La notion de précompacité a le plus d'importance dans le cas des 
espaces métriques, dont il sera question au paragraphe suivant. 


$ 7. Compacité dans les espaces 
métriques 


1. Ensembles totalement bornés. Comme les espaces métriques 
représentent un cas particulier des espaces topologiques, toutes les 
définitions et tous les résultats, établis au paragraphe précédent, 
sont valables pour les espaces métriques. Dans le cas des espaces 
métriques la notion de compacité est étroitement liée à la notion 
d'ensemble totalement borné que nous introduisons 
ci-après. 

Soit M un ensemble quelconque d’un espace métrique À et soit & 
un nombre positif quelconque. On dit que l’ensemble À € R est un 
e-réseau de M, si pour tout point x € M il existe au moins un point 
a € À tel que p (x, a) < &e. (L'ensemble À n’est pas forcément inclus 
dans M et peut même n’avoir aucun point commun avec M ; pourtant, 
s’il existe un e-réseau À de MW, on peut en construire un 2e-réseau 


B<c M.) 
Par exemple, les points du plan ayant des coordonnées entières 


forment un -7z réseau de ce plan. Un ensemble M est dit fotalement 


borné, si pour tout e >> 0 il existe un e-réseau fini de M. Il est 
clair que tout ensemble totalement borné est nécessairement borné 
(contenu dans une boule), comme une réunion finie d'ensembles 
bornés. Comme le montre l’exemple 2 ci-dessous, la réciproque n’est 
pas, en général, vraie. 

Il est souvent utile d’avoir en vue la remarque évidente sui- 
vante: si un ensemble M est totalement borné, sa fermeture \M] l’est 


aussi. 
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De la définition d’un ensemble totalement borné il résulte immé- 
diatement que si l’espace métrique R est lui-même totalement borné, 


' . 4 , 
alors ilest séparable. En effet, construisons dans À un —-réseau pour 


PE 4, 
chaque valeur de n. La réunion de ces réseaux pour toutes les va- 


leurs de n est un ensemble dénombrable, partout dense dans À. Comme 
tout espace métrique séparable possède une base dénombrable (cf. 
théorème 4, $ 5), on en déduit que tout espace métrique totalement 
borné possède une base dénombrable. 

Exemples. 1. Dans un espace euclidien à nr dimensions, 
dire qu’un ensemble est totalement borné équivaut à dire qu'il est 
tout simplement borné, c.-à-d. qu'il est possible d’en- 
fermer cet ensemble dans un cube suffisamment grand. En effet, si 
un tel cube est divisé en petits cubes d’arête &, les sommets de ces 
derniers formeront un Va e-réseau fini pour le cube initial et, à 
plus forte raison, pour tout ensemble placé à son intérieur. 

2. La sphère S de rayon 1 dans l’espace /, nous fournit un exem- 
ple d'ensemble borné, mais non totalement borné. En effet, considé- 
rons dans S les points: 


e = (1,0,0,..., 0,0,...) 
es = (0, 1,0,..., 0,0, ...), 
en = (0, 0, O, ’ 1, O, ), 


La distance de n’importe quels deux de ces points e, et 
Em (n = m) est égale à V 2. Ceci montre que dans S il n’existe aucun 


E-réseau pour & << V2 
3. Considérons dans /, l’ensemble IT des points 
Z = (X4, Lo, . . ., Tns . . .) 
vérifiant les conditions 
1 1 
EAESE [ST , +. tn <<; ….. 


Cet ensemble s'appelle parallélépipède fondamental (ou « pavé hil- 
bertien ») de l’espace /:. Il sert d’exemple d'ensemble de dimension 
infinie totalement borné. Pour démontrer qu’il est totalement borné 
on procède de la manière suivante. 

€ 


Soit donné € >> 0. Choisissons rz de façon que na <> 


A chaque point 
ZT = (Xi, Lo, . .., An, + ..) (1) 
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de IT faisons correspondre le point 
LŸ — (x, Lo, . . ., An, 0, 0, ...) (2) 
du même ensemble. Il vient 


ane ÿ D ae Lee 


k=n+1 k=n 


L'ensemble IT* des points de la forme (2) appartenant à IT est tota- 
lement borné (comme ensemble borné dans un espace à n dimensions). 


_. € , . . . 
Choisissons dans IT un z réseau fini. Il est clair que ce dernier sera 
en même temps un e-réseau de l’ensemble II. 

2. Espaces totalement bornés et compacité. 


Théorème 1. Si l’espace métrique R est dénombrablement 
compact, alors il est totalement borné. 


Démonstration. Supposons que l’espace R ne soit pas 
totalement borné. Cela signifie que pour un certain £, > 0, dans À 
il n'existe pas de &,-réseau fini. Soit a, un point arbitraire de À. 
Il existe au moins un point de R soit a2, tel que p (a, a2) > € 
(sinon, le point a; formerait un e,-réseau de R). De la même façon, 
dans À on peut trouver un point a; tel que 


p (a, a3) > 80 et p (as, 43) > 80; 


autrement le couple de points a;, a, serait un e,-réseau de À. Si les 


points a;, ..., a, sont déjà fixés, choisissons un point a,:,€R 
tel que 

p(ai, an) > En i=1, 2, ...,k. 
A l’aide de ce procédé on obtient une suite infinie @, &2, . . . qui 


n’a aucun point d’accumulation, étant donné que p (a;, a;) > &o 
pour i Æ j. Maïs alors l’espace R n’est pas dénombrablement com- 
pact. Le théorème est démontré. 

Ainsi, nous avons démontré que pour les espaces métriques la 
compacité dénombrable implique la propriété de l’espace d’être 
totalement borné, qui à son tour implique la présence d’une base 
dénombrable. 

En vertu du théorème 10, $ 6, on en déduit le résultat important 
suivant. 

Corollaire. Tout espace métrique dénombrablement compact 
est un espace compact. 

Nous avons montré que la propriété d’un espace métrique d’être 
totalement borné est une condition nécessaire pour qu'il 
soit compact. Cette condition n’est pas suffisante; par 
exemple, l’ensemble des points rationnels du segment [0, 1], muni 
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de la distance habituelle, est un espace totalement borné, mais non 
compact : la suite de points de cet espace 


0; 0,4; 0,41; 0,414; 0,4142; . .., 


c.-à-d. la suite des valeurs décimales approchées par défaut du nom- 


bre V 2—1, n’a aucun point d’accumulation dans cet espace. Pour- 
tant, on a le théorème suivant. 


Théorème 2. Pour qu'un espace métrique R soit compact, 
il faut et il suffit qu'il soit à la fois: 

1) totalement borné, 

2) complet. 


Démonstration. La nécessité de la condition 1) a été 
déjà établie. Quant à la nécessité de la condition 2), elle est évi- 
dente ; en effet, si {x, } est une suite de Cauchy non convergente dans 
R, elle ne peut avoir dans À aucun point d’accumulation. 

Montrons maintenant que si l’espace À est totalement borné et 
complet, alors il est compact. En vertu du corollaire du théorème 1, 
il suffit pour cela de démontrer que À est dénombrablement com- 
pact, c.-à-d. que toute suite {x,} de points de À a au moins un point 
d’accumulation. 

Entourons d’une boule fermée de rayon 1 chaque point qui fait 
partie d’un 1-réseau de À. Comme ces boules sont en nombre fini 
et recouvrent tout l’espace R, au moins l’une d'elles, soit B;,, con- 
tient une sous-suite infinie x, ..., x, ... de la suite {x,}. 


._. . 4, 
Choisissons ensuite dans B, un 7 réseau et entourons chacun de ses 


. ’ 2 1 . , 
points d’une boule fermée de rayon 5 Au moins l’une de ces boules, 


désignons-la par B;:, contient une sous-suite infinie x, ..., 
., a, ... de la suite {x}. De la même façon, on trouvera une 


boule fermée B, de rayon _. ayant le centre dans B, et contenant une 


sous-suite infinie x”, ..., x, ... de la suite {x}, etc. Consi- 
dérons maintenant avec chaque boule B, une boule fermée À, ayant 
le même centre, mais un rayon deux fois plus grand. Il est aisé de 
voir que les boules À, sont emboîtées. Comme l’espace À est complet, 


l'intersection f|] À, n’est pas vide et contient un seul point xo. 
n=1 

Ce point est un point d’accumulation de la suite initiale {x,}, car 
tout voisinage de x, contient une boule B,, donc, une sous-suite 
infinie {1%} de la suite {x, }. 

3. Ensembles précompacts dans un espace métrique. La notion 
de précompacité, introduite au paragraphe précédent pour les sous- 
ensembles d’un espace topologique arbitraire, est valable, en parti- 
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culier, pour les sous-ensembles d’un espace métrique. En outre, il 
est évident que dans le cas des espaces métriques il y a identité entre 
la notion de précompacité et celle de précompacité dénombrable. 
Il convient de mentionner la proposition simple, mais importante, 
qui suit. 


Théorème 3. Pour qu'un ensemble M, inclus dans un espace 
métrique complet R, soit précompact, il faut et il suffit que cet ensemble 
soit totalement borné. 


Ceci découle immédiatement du théorème 2 et du fait évident 
que tout sous-ensemble fermé d’un espace métrique complet est lui- 
même complet. 

L'importance de ce théorème réside dans le fait que dans la plu- 
part des cas il est plus facile de démontrer qu’un ensemble est tota- 
lement borné que d'établir directement sa précompacité. Tout de 
même, lorsqu'il s’agit des applications en analyse, c’est la précom- 
pacité qui est d'habitude plus importante. 

4. Théorème d’Arzelà. Le problème consistant à déterminer, 
si tel ou tel ensemble est compact dans un espace métrique, est assez 
fréquent en analyse. Par ailleurs, lorsqu'on essaie d'appliquer direc- 
tement le théorème 2, on se heurte à des difficultés. C’est pour- 
quoi, pour les ensembles contenus dans des espaces concrets, il est 
utile d'établir des critères de compacité (ou de précompacité) spé- 
ciaux, plus commodes dans la pratique. 

Dans un espace euclidien à r dimensions, pour qu’un ensemble 
soit précompact, il faut et il suffit, comme on l’a vu plus haut, qu'il 
soit borné. Mais pour des espaces métriques plus généraux ceci n’est 
plus vrai. 

L'un des espaces les plus importants de l'analyse des espaces 
métriques est l’espace C [a, b]. Pour ses sous-ensembles un critère 
de précompacité important et fréquemment utilisé est fourni par le 
théorème d’Arze là. 

Pour formuler ce théorème il est indispensable d'introduire les 
notions suivantes. 

Une famille ® de fonctions œ, définies sur un segment [a, bl], 
est dite uniformément bornée, s’il existe un nombre XÆ tel que 


[paI<X 


pour tous les x € [a, b] et toutes les fonctions @ € D. 
Une famille D — {@} est dite équicontinue, si à tout e > 0 on 
peut faire correspondre un nombre Ô > 0 tel que 


| p (xs) — p 2) 1 < € 


pour tous les x, et x, appartenant à [a, b] et tels que p (x:, x2) << Ô 
et pour toutes les fonctions @ € ®. 
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Théorème 4 (d'Arzelà). Pour qu’une famille O de fonc- 
tions continues, définies sur le segment la, b], soit précompacte dans 
C Ta, b], il faut et il suffit que cette famille soit uniformément bornée et 


équicontinue. 


Démonstration. La condition est néces- 
saire. Supposons la famille ® précompacte dans C la, b]l. Alors, 


selon le théorème précédent, pour chaque e >> 0 il existe un + -ré- 


seau fini ®, 2, . . ., px de la famille ®. Chacune des fonctions v; 
est bornée, comme fonction continue sur le segment [a, bl]: 


lp: GI < Ki. 
£ 


Posons À — max K; + _. D’après la définition d’un 3 réseau. 
pour chaque @ € ® il existe au moins une fonction ®; telle que 


p(p, p)=max|g (x) — qi (a) IT 


Par conséquent, 
lp) IR IP: (2) + <Ki++<K. 


Donc, la famille D est uniformément bornée. 

D'autre part, chacune des fonctions œ; du —-réseau étant conti- 
nue sur le segment [a, b] est aussi uniformément continue sur ce 
segment. Donc, à tout + on peut faire correspondre Ô; tel que 

| Pi (r)—p(m)| << + 
Si | Z4 — Zo |  Ô;. 

Posons Ô — min 6;. Soit @ une fonction arbitraire de la famille: 
®. Faisons-lui correspondre une fonction ; telle que p (@, p;) < _ 
Alors pour | x, — x» | <ôona 
[q (rs) — p (22) KT (rs) — pi (2) 1 + pi (xs) — pi (te) + 


+ pie) pa) < + +5 ee 


D'où l’équicontinuité de la famille ®. 
La condition est suffisante. Soit ® une famille 


de fonctions uniformément bornée et équicontinue. Conformément 
au théorème 3, pour établir la précompacité de cette famille dans. 
C Ta, b], il suffit de montrer que pour tout e > O0 il lui correspond 
dans C [a, b] un &-réseau fini. Soit 


IpRI< AK 
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pour toutes les fonctions @ € D et soit Ô > 0 tel que si | à; — to | 
<Tôona 


[p()— pm) <+ 


pour toutes les fonctions @ € ®. Partageons le segment [a, b] de 
l'axe x par les points x0 = M ti t2 LL... LI, — beninter- 
valles de longueur inférieure à Ô et traçons par ces points des droites 
verticales. Partageons ensuite le segment [—X, X] de l'axe y par 


les points yo = —K y <LYy2 << ... Ym = K en intervalles de 
longueur inférieure à _ et traçons par les points de subdivision des 


droites horizontales. Le rectangle a£<x<b, —K <y< K se 
trouvera alors partagé en petits rectangles ayant le côté horizontal 


e Ld e « A Lé L e Lé e % £ e 
inférieur à Ô et le côté vertical inférieur à F À chaque fonction 


€ ® faisons correspondre une ligne brisée 4 (x) ayant pour sommets 
les points (xx, y), c.-à-d. les nœuds du réseau construit, tels que 
pour x = x, l'écart de œ (x) à 1 (x) soit inférieur à _ (l'existence 
d’une telle ligne brisée est évidente). 

Puisque par construction 


par) — Da) <—+ , 


MENSUIOMIRS 
‘et 


| P (xx) — P (tan) | < — , 
‘On à 


3e 
FD Car) — Ÿ (ar) <= 
La fonction 4% (x) étant linéaire entre les points x; et x,+1, on a 


Ga) — (0) < À 


pour tous les x € [xx, Tax]. 

Soit maintenant x un point quelconque du segment la, b] et x} 
celui des points de subdivision choisis qui est le plus proche de x 
à sa gauche. Alors on a 


Lo (x) — D GI < op (x) — p (x) | + 
+ Top (xx) — À (ex) | + Tp (x) — VISE. 


Par conséquent, les lignes brisées 1% (x) forment un æe-réseau de ®. 
Il est évident qu’elles sont en nombre fini. On en conclut que la 
famille D est totalement bornée. 

Le théorème est entièrement démontré. 
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5. Théorème de Péano. Montrons, comment s'applique le théorème d’Arzelà, 
en prenant pour exemple, le théorème d’existence suivant pour les équations 
différentielles ordinaires à second membre continu. 


Théorème 5 (de Péano). Soit donnée une équation différentielle 
dy EL 
x — f (x, y). (3) 


Si la fonction f est continue dans un domaine borné et fermé G, alors quel que soit 
de point (xo, Yo), intérieur à ce domaine, il existe au moins une courbe intégrale de 
l'équation donnée, passant par ce point. 


Démonstration. Comme la fonction f est continue dans un domaine 
borné et fermé, elle est aussi bornée: 


|f (&, y) | << M = const. 


Traçons par le point (xs, yo) deux droites à coefficients angulaires M et —M. 
Traçons ensuite deux droites verticales x — a et x — b de façon que les deux 
triangles à sommet commun (xs, yo), qu’elles déterminent avec les deux précé- 
dentes, soient situés entièrement à l’intérieur du domaine G. 

Ce couple de triangles forme un ensemble fermé A. 

Construisons pour l'équation donnée une ligne brisée dite d’Euler de la 
manière suivante : par le point (xs, yo) traçons une droite de coefficient angulaire 
f (to: Yo) ; par un point quelconque (x4, y1) de cette droite traçons une droite de 
coefficient angulaire f (2x1, y1); par un point quelconque (x2, y2) de la dernière 
droite traçons une nouvelle droite ayant pour coefficient angulaire f (x, yo), 
etc. Considérons maintenant une suite de lignes brisées d’Euler L4, Lo, . .. 
.<.., Ln,s ... passant par le point (xs, Yo) et telles que la longueur du plus grand 
maillon de la figne L} tende vers zéro pour #4 — oo. Désignons par œ} la fonction 
ayant pour graphe la ligne brisée L;. Les fonctions q4, Pa, . . ., Pr, . . . jouis- 
sent des propriétés suivantes : 

1) elles sont définies sur le même segment [a, b], 
2) elles sont uniformément bornées, 
3) elles sont équicontinues. 
En vertu du théorème d’Arzelà, de la suite {p,} on peut extraire une suite 
uniformément convergente, soit (4), pt), ..., ph) , ... 
Posons @ (x) — lim (# (x). Il est clair que ® (xo) = yo. Il reste à vérifier 
kR — 00 


si la fonction satisfait sur [a, b] à l'équation différentielle donnée. Pour cela 
il faut montrer que pour tout € > 0 on a - 


PEINE je, (2) | <e, 


z'— x 


à condition que la différence | x” — x’ | soit suffisamment petite. Pour la démons- 
tration de ce fait il faut d’abord montrer que pour k assez grand on a 


POIL ED Re, px!) 


z'— zx! 


<E, 


pourvu que la différence | x” — x’ | soit suffisamment petite. 
Comme la fonction f est continue dans le domaine G, à tout & => 0 on peut 
faire correspondre n >> 0 tel que 


f(x", y)—e<f(x, y) <f(x, y) + e (y = p (x)), 


si 
[r—z |[<2net [y — y" | < 4Mn. 
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L'ensemble des points (x, y) € G vérifiant ces deux inéquations représente 
un rectangle Q. Soit maintenant X tellement grand que pour tout 4 => X on ait 


| p (x) — ph (x) | <'4n 


et tous les maillons de la ligne brisée L; aient la longueur inférieure à n. Alors 
pour [æ— x" | << 2n toutes les lignes brisées d'Euler ph) avec 4 > X seront 
situées entièrement à l’intérieur de Q. 

Soient, d’autre part, (ao, bo), (ay, b4), + « +, (@n+1: bn+1) les sommets de la 
ligne brisée L} et soit 

ap LL LA Lao Le. Lan LT" L'An+1 

(pour fixer les idées on suppose x” > x’; pour x” < x’ toutes les considérations 
sont analogues). Alors pour les fonctions th) correspondantes on a: 


PA (a) — ph (x) = f (ao, bo) (&1— 2"), 
PA (ais) — PO (a) =f (ai, bi) (isa),  i=1,2,..., n—1, 
ph (x) — ph (an) =f (ans bn) (2"— an). 
Pour |” — zx" | <n de ces égalités on obtient: 
[f(z’, y')—e] (a — x") << (a) — pt (x) [f (x, y')+e] (ai — 2"), 
[f (', y')—E] (isa — ai) < ph (a:41) — 
— ph (a;) f(x’, y') He] (ais — a);  i=1, 2, ..., n—1, 
[(&', y')—e](z"—an) < pt (27) — po (an) LI (x’, y')+e] (z"— an). 


D! 


En additionnant ces inégalités membre à membre, on obtient 
[f (x', y) — el 2" — 27) << ph (27) — pr (x) ff (x, y’) + el (x — 7’), 


ce qu'il fallait démontrer. 

Des sous-suites différentes de lignes brisées d’Euler peuvent converger vers 
des solutions différentes de l’équation (3). On en conclut que la solution de 
l'équation y’ = f (x, y) passant par le point (xs, yo) n’est pas en général unique. 


6. Continuité uniforme. Applications continues des compacts 
métriques. Pour les applications d’un espace métrique dans un autre, 
en particulier, pour les fonctions numériques définies sur un espace 
métrique il y a en plus de la notion de continuité une autre notion 
qui a un sens et présente de l’importance pour l'analyse. C’est la 
notion de continuité uniforme. Une application F d’un espace métri- 
que À dans un espace métrique Ÿ est dite uniformément continue, si 
à tout & >> 0 on peut faire correspondre Ô >> 0 tel que si p4 (21, to) 
<< Ô, on a p2 (F (xs), F (x2)) <'e (ici p, désigne la distance sur X 
et p2 la distance sur Ÿ), ô étant dépendant seulement de € et non de 
Xi Et Lo. 

Exercice. Montrer que la fonction numérique F (x) — sup x (t), 
définie sur l’espace C[a, b]l, est uniformément continue. Fe 


Pour les applications continues des compacts métriques on a le 
théorème suivant qui généralise le théorème bien connu de l’ana- 
lyse élémentaire sur les fonctions continues sur un segment. 
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Théorème 6. Toute application continue d'un compact métri- 
que dans un espace métrique est uniformément continue. 


Démonstration. Soit F une application continue, mais 
non uniformément continue, d’un compact métrique À dans un espace 
métrique M. Cela signifie que pour un certain € >> 0 et pour tout 
entier naturel n on peut trouver dans Æ deux points x, et x, tels que 


, 1 
P1 (Zn; Tn) < 7 


et pourtant 
P2(F (tn), F(xr)) ZE 


{o, désigne la distance sur X et p, la distance sur M). En vertu de 
la compacité de Æ, de la suite {x,} on peut extraire une sous-suite 
{tn,} Convergeant vers un point x € K. Alors la suite {x} converge 
aussi vers x. D'autre part, pour chaque valeur de £ au moins l’une 
des inégalités 


Pa (F (x), F(an)>+, p(F (x), Fa )>e: 


est vérifiée, ce qui contredit l'hypothèse que l'application F est 
continue au point x. 

7. Théorème généralisé d’Arzelà. Soient X et Ÿ deux compacts 
métriques et C>y l’ensemble des applications continues ÿ de X dans 
Y. Introduisons dans C+y une distance à l’aide de la formule 


p(f, g)=supp(f(x), g(x)). 
xEX 


On vérifie facilement que C;7 devient alors un espace métrique. 


Théorème 7 (théorème généralisé d'Arze- 
l à). Pour qu'un ensemble D € Cxy soit précompact, il faut et il 
suffit que les fonctions f appartenant à D soient équicontinues. 


Cela signifie que pour tout & >> 0 il doit exister un Ô = 0 tel que 
p (x, x) < (4) 


p ( (@), f 7) <'e (5) 


quelles que soient les fonctions f € D et quels que soient les points 
x" et x” de À. 

Démonstration. On démontre que la condition est né- 
cessaire comme dans le théorème 4. 

Démontrons que la condition est suffisante. Pour cela, prolongeons 
Cxy dans l’espace My de toutes les applications du compact X 
dans le compact Ÿ, muni de la même métrique que Cxy: 


p(7; g)=supp(f(x), g(x)) 
xEeX 


entraîne 
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et démontrons que l’ensemble D est précompact dans M,. Comme 
Cxy est fermé dans Mzy !). la précompacité de l’ensemble D dans 
M xy implique sa précompacité dans Cry. 

Donnons-nous un € >> 0 arbitraire et choisissons Ô tel que l’iné- 
galité (4) entraîne (5), quels que soient f E D et x’, x" E X. Il est 
aisé de voir que À peut être mis sous la forme d’une réunion finie 
d’ensembles disjoints Æ; tels que si x’, 2" € E;, on a p (x’, x”) < &. 
En effet, pour cela il suffit de choisir les points x,, ze, ..., «, de 


façon qu'ils forment un 2 -réseau de X et de poser, par exemple, 


Ei=B (x, 7) NUs (xs, +) , 


où B (x;, Ô/2) est une boule de rayon 2 et de centre x;. 


Considérons maintenant dans le compact Ÿ un &-réseau fini quel- 
COnqUe Yy, Yo, + + +5 Um Cet Soit L l’ensemble des fonctions g (x) 
prenant sur les ensembles £; les valeurs y;. Il est clair que ces fonc- 
tions sont en nombre fini. Montrons qu’elles forment un 2e-réseau de 
D dans M3. En effet, soit f € D. A tout point x; de {x;, ..., x} 
on peut faire correspondre un point y; de {ys, . .., Um} tel que 


p ( (ti), ÿj) < €. 


Soit la fonction g € L choisie de façon que £g (x;) = y;. Alors, si 
i est choisi de façon quex € E;,ona 


px), 8 @) < p CF (x), f Gi) + p G Gi), & (xi)) + 
+ p (g (ri), g (x)) < 2e. 


On en déduit que l’ensemble fini L est bien un 2e-réseau de l’en- 
semble D, de sorte que D est précompact dans My et, par consé- 
quent, dans Cxy également. 


$ 8. Courbes continues dans les espaces 


métriques?) 
Soit une application continue 
P= j(1) 


du segment a < t < b dans un espace métrique R. Quand t « parcourt » le seg- 
ment de a à b, le point correspondant P « parcourt » dans l’espace R « une courbe 
continue ». Nous aurons à donner des définitions rigoureuses concernant l’idée 
qu’on vient d'exposer en termes grossiers. L'ordre dans lequel un point parcourt 
la courbe est important. Ainsi, le même ensemble représenté sur la figure 12, 


1) C’est parce que la limite d’une suite uniformément convergente d’appli- 
cations continues est une application continue. Cette proposition est la généra- 
lisation d’un théorème bien connu de l’analyse et se démontre exactement com- 
me ce dernier. 

2) Ce paragraphe n’est pas nécessaire pour la suite. Le lecteur pourra 
donc, à volcnté, l’omettre. 
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parcouru dans les deux sens indiqués sur les figures 13 et 14, sera considéré comme 
deux courbes différentes. On obtient un deuxième exemple, en consi- 
dérant la fonction réelle définie sur le segment [0, 1] qui est représentée sur la 
figure 15. Elle définit une « courbe » située sur le segment [0, 1] de l’axe y, mais 
différente de ce segment, parcouru une seule fois du point 0 au point 1, car le 
segment [A, B] est parcouru trois fois (deux fois du bas en haut et une fois du 
haut en bas). 

Cependant, lorsque le sens de parcours est le même nous 
considérerons le choix du « paramètre » £ comme n’ayant pas d'importance. Par 


A N << 
Fig. 12 Fig. 13 Fig. 14 


exemple, les fonctions représentées sur les figures 15 et 16 définissent une même 
« courbe » située sur l’axe y, bien que les valeurs du paramètre t correspondant 
à un point quelconque de la courbe puissent être diflérentes dans le cas de la 
figure 15 et celui de la figure 16. Ainsi, sur la figure 15 au point À correspondent 


Fig. 19 Fig. 16 


sur l’axe £ deux points isolés, tandis que sur la figure 16 il lui correspond ur 
point isolé et un segment situé plus à droite (quand t parcourt ce segment, le point 
de la courbe reste immobile). (L'admission de tels segments de fixité du point 
P = f(t) sera commode dans la suite pour l’étude de la compacité d’une famille 
de courbes.) 

Passons aux définitions formelles. Deux fonctions continues 


P=j(t)etP=f (Er), 
définies respectivement sur les segments 
a L<t<Lb'eta” Lt Lb” 


ct prenant des valeurs dans l’espace métrique R, seront dites équivalentes, s'il 
existe deux fonctions continues non décroissantes 


= pi) et = pp" (), 
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définies sur un segment 
a<t<hb 
et telles que 
(a) —= a", op (b) = b, 
p"(a)= a", q"(b) = b”, 
f To" (1 = jf” Le” (], 


quel que soit 4 E [a, b]. 

Il est aisé de voir que la relation d'équivalence ainsi définie est réflexive 
{f est équivalent à f), symétrique (si f’ est équivalent à f”, alors f” est équivalent 
à f') et transitive (équivalence de f’ et f” et celle de f” et f”’ impliquent l’équiva- 
lence de f’ et f”’). Par conséquent, les fonctions continues du type considéré se 
trouvent partagées en classes de fonctions équivalentes entre elles. Chacune de 
ces classes définit dans l’espace R une courbe continue. 

Quelle que soit la fonction P = f’ (t’) définie sur un segment quelconque 
{a’, b’], on peut lui associer une fonction équivalente définie sur le segment 
{[a”, b"] = [0, 1]. En effet, pour cela il suffit de poser !) 


= pt) = (b — a )t+a, = p'(t)=t. 


Donc, toute courbe peut être représentée paramétriquement à l’aide d’une fonc- 


tion définie sur le segment [0, 1]. 
De ce fait, il est utile de considérer l’espace Cr,rR des applications continues 
{ du segment Z — [0, 1] dans R, muni de la métrique 


p (f, &) =supp (f (4), g (6). 


Nous dirons que la suite de courbes L;, Lo, . .., Lan, . . . converge vers la 
courbe Z, si les courbes ZL,, et Z peuvent être représentées paramétriquement par 


des fonctions 
P=f,(t), 0<1t<1 


: ES 
€ 
Pt, 0<i<1 


telles que p (f, fn) — 0 pour n — co. 
En appliquant le théorème généralisé d’Arzelà (théorème 7, $ 7), on démon- 


trera facilement le théorème suivant. 


Théorème 1. Si la suite de courbes L4, La, . . ., L,, . .. appartenant 
à un compact K peut être représentée paramétriquement par des fonctions équicon- 
tinues sur le segment [0, 1], alors de cette suite on peut extraire une sous-suite con- 


vergente. 
Définissons maintenant la longueur d’une courbe représentée paramétrique- 


ment par la fonction 
P=f(t,a<t<b, 


comme la borne supérieure des sommes 
nm, 
D pi). f (ti)), 
i=1 


où les points #; sont soumis aux seules conditions: 
a = LU Leo. Kt<Kree Lln — b. 


1) Nous supposons a < b. Cependant, nous n’excluons pas les «courbes » 
constituées d’un seul point que l’on obtient, si la fonction f (t) est constante 
sur {[a, b]. Ceci est également commode pour la suïte. 
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Il est aisé de voir que la longueur d’une courbe ne dépend pas desa repré- 
sentation paramétrique. En se limitant aux représentations paramétriques par des 
fonctions définies sur le segment [0, 1], on peut démontrer facilement que la 
longueur d’une courbe est une fonctionnelle semi-continue inférieurement dépen- 
dant de f (dans l’espace C;2). En langage géométrique ce résultat peut être ex- 
primé sous la forme du théorème suivant portant sur la semi-continuité. 


Théorème 2. Si la suite de courbes {Ln} converge vers une courbe L, 
alors la longueur de la courbe L est inférieure ou égale à la limite inférieure des lon- 
gueurs des courbes L,. 


Considérons maintenant spécialement les courbes de longueur 
finie. Soit une courbe admettant la représentation paramétrique: 


P=f(h,a<t<b. 


La fonction f, considérée seulement sur le segment [a, 7], où a < T < b, définit 
le « segment initial » de cette courbe du point 


Pa = f (a) 
au point 

Pr = f(T). 
Soit 

s = p(T) 


sa longueur. On vérifie facilement que 
P=g(s) = fl" (sl 
est une autre représentation paramétrique de la même courbe, Le nouveau para- 
mètre s parcourt le segment 
O0<s<S, 
où S$ est la longueur de la courbe considérée toute entière. Cette représentation 
vérifie la condition 
p (g (a), g (2) KT 8 — 


(l'arc n'est pas plus court que la corde). 
En passant au segment [0, 1], on obtient la représentation paramétrique 


P=F(t)=e (5), = 
vérifiant la conditton de Lipschitz: 


p(F(u), Fm) <S[T—T%l. 
On voit donc que toutes les courbes de longueur 
S< M, 


où M est une constante, peuvent être représentées paramétriquement par des fonc- 
tions équicontinues définies sur le segment [0, 1]. Par conséquent, à ces fonctions 
on peut appliquer le théorème 1. 

Mettons en évidence la puissance des résultats généraux obtenus sur l’exem- 
ple de la démonstration du théorème important suivant. 


Théorème 3. Si dans un compact K deux points À et B peuvent être 
joints par des courbes continues de longueur finie, alors parmi toutes ces courbes il 
existe une de longueur minimale. 


En effet, soit Y la borne inférieure des longueurs des courbes joignant les 
points À et B du compact Æ. Soit L4, L:, ..., L,, ... une suite de courbes 


8—0167 
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joignant À et B dont les longueurs tendent vers Ÿ. D ’après le théorème 1 de cette 
suite on peut extraire une sous-suite convergente. En vertu du théorème 2, la 
courbe limite de cette sous-suite ne peut pas avoir une longueur plus grandé 


que Ÿÿ. 
Notons que même dans le cas où Æ est une surface fermée lisse (suffisamment 


de fois différentiable) de l’espace euclidien à trois dimensions, ce théorème ne 
découle pas immédiatement des résultats établis dans le cours de géométrie 
différentielle, où l’on se borne habituellement au cas des points À et B suffisam- 


ment proches l’un de l’autre. 
Tout ce qui vient d’être exposé ici acquerrait plus de clarté si on munissait 


l’ensemble des courbes de l’espace métrique À d’une structure d'espace métrique. 
Ceci peut être réalisé, en définissant la distance de deux courbes L; et L: par la 


formule 
ro) (La, Lo) — inf p (F1 f2)s 


où la borne inférieure est prise sur l’ensemble de tous les couples possibles de 
représentations paramétriques des courbes Z; et Z> respectivement par les fonc- 
tions 

— f1 (6), 0<I<1, 


et 
P= fi (t, 0<t<1. 


La démonstration du fait que la distance ainsi définie vérifie les axiomes 
habituels est assez simple, à l'exception du détail suivant : on rencontre certaines 
difficultés pour démontrer que l'égalité 

p (L4, L:) = 0 


implique l'identité des courbes ZL; et L:. Ceci s'explique par le fait que dans la 
formule qui définit la distance p (L4, L2) la borne inférieure est atteinte pour un 
choix convenable des représentations paramétriques jf, et f. Mais la démonstra- 
tion de cette dernière affirmation est à son tour loin d’être simple. 


CHAPITRE III 


Espaces vectoriels normés 
et topologiques 


$ 1. Espaces vectoriels 


La notion d'espace vectoriel est l’une des plus importantes en 
mathématiques. Elle va jouer un rôle important non seulement dans 
ce chapitre, mais aussi dans toute la suite. 

1. Définition et exemples d'espaces vectoriels. 

Définition 141. Un ensemble non vide Z d'éléments 
Z, y, Z, . . . est appelé espace vectoriel ou linéaire, s’il satisfait aux 
conditions suivantes : 

I. Quels que soient les éléments x, y € L, il leur correspond 
(suivant une loi bien déterminée) un élément et un seul z € L, appelé 
leur somme et noté x + y, la correspondance donnée jouissant des 
propriétés suivantes : 

1) x + y = y + x (commutativité), 

2) x + (y + z) — (x + y) + z (associativité), 

3) dans Z il existe un élément 0 tel que x + 0 — x, quel que 
soit x € L (existence d’un élément nul), 

4) quel que soit x € L, il existe dans L un élément —x tel que 
x + (—x) — 0 (existence d’un élément opposé). 

II. Quels que soient le nombre « et l’élément x € L, il leur cor- 
respond (suivant une loi bien déterminée) un élément et un seul 
ax € L. nommé produit de l’élément x par le nombre &, cette cor- 
respondance jouissant des propriétés : 


1) œ (Br) — (af) x, 

2) lex = x, 

3) (a + B)x = ax + Pr, 
4) œ (x + y) = ax + ay. 


Suivant que l’ensemble des nombres que l’on utilise renferme 
tous les nombres complexes ou seulement les nombres réels, l’espace 
vectoriel considéré est dit complexe ou réel 1). Sauf indication du 
contraire, nos considérations seront valables aussi bien pour les 
espaces réels que pour les espaces complexes. 


1) On peut même considérer des espaces vectoriels sur un corps commutatif 
arbitraire. 


S* 
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Notons que tout espace vectoriel complexe se réduit à un espace 
réel, si l’on se limite à la multiplication d’un vecteur par des nom- 
bres réels. 

Considérons quelques exemples d’espaces vectoriels, en laissant 
au lecteur le souci de vérifier que chacun d'eux satisfait aux axio- 
mes formulés ci-dessus. 

4. La droite numérique R!, c.-à-d. l’ensemble des nombres réels 
avec les opérations arithmétiques d’addition et de multiplication 
habituelles constitue un espace vectoriel. 

2. L'ensemble des systèmes ordonnés de n nombres réels x — 


— (11, Xo, . . ., t), dans lequel l’addition et la multiplication par 
un nombre réel sont définies par les formules 
(x, Laos + +.) Tn) + (y: U2s + + .; Un) — 
= (ti + Ya Lo + Ya + + + Xn + Ynhs 
@ (ty, Los + + ., Xn) — (Ty, Oo, . . ., AT»), 


est aussi un espace vectoriel. On l'appelle espace arithmétique réel à n 
dimensions À!) et on le note par le symbole R'. De manière analogue, 
on définit l’espace arithmétique complexe à nr dimensions C”, en 
considérant cette fois l’ensemble des systèmes ordonnés de n nom- 
bres complexes (avec la multiplication par n'importe quel nombre 
complexe). 

3. Les fonctions (réelles ou complexes) continues sur un segment 
[a, b], avec les opérations habituelles donnant la somme de deux 
fonctions et le produit d’une fonction par un nombre, constituent un 
espace vectoriel (l’un des plus importants en analyse) que l’on désigne 
par C la, bl. 

4. L’espace !, ayant pour éléments les suites infinies de nombres 
(réels ou complexes) 

X = (y, Lo, . . ., Ln, + . …), 

telles que 


» [Tn l < %, (1) 
n=1 
avec les opérations 


(ti, Los ee ns + +) + (Yu, Ya, + + +, Uns + + +) = 
= (ti + Ya, Lo + Yo; +.) Zn À Un) .….), 
@ (Xi, Los + +, Tn, + + +) = (AT, AT, . . ., OTn, . - .), 
est un espace vectoriel. Le fait que la somme de deux suites vérifiant 
la condition (1) est une suite qui vérifie aussi cette condition résulte 
de l'inégalité évidente 
(ai + a2) < 24° + 2aï. 


1) Ce terme sera expliqué dans la suite. 
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5. L'ensemble des suites convergentes x — (x,, x2, . . .), dans 
lequel l’addition et la multiplication par un nombre sont définies 
comme dans l'exemple précédent, est un espace vectoriel. On le 
désigne par c. 

6. Les suites convergeant vers O0, avec les mêmes opérations 
d’addition et de multiplication par un nombre, forment aussi un 
espace vectoriel que l’on désigne par co. 

7. L'ensemble m des suites numériques bornées, avec les mêmes 
opérations d’addition et de multiplication par un nombre que dans 
les exemples 4-6, constitue également un espace vectoriel. 

8. Enfin, l’ensemble R° de toutes les suites numériques, 
avec les mêmes opérations d’addition et de multiplication par un 
nombre que dans les exemples 4-7, est aussi un espace vectoriel. 

Comme les propriétés d’un espace vectoriel se traduisent par les 
propriétés de l’addition de ses éléments et de leur multiplication 
par un nombre, il est naturel de donner la définition suivante. 

Définition 2. Deux espaces vectoriels L et L* sont dits 
isomorphes, s’il est possible d'établir entre leurs éléments une cor- 
respondance biunivoque, compatible avec les opérations définies 
dans ZL et L*. Cela signifie que si 


z <> x* 
et 
y + y* 
(x, y, EL, a*,y* € L*), on a aussi 
T+y a + y* 
et 
ax <> ax* 


(où & est un nombre arbitraire). 

Deux espaces isomorphes peuvent être considérés comme réali- 
sant un seul et même espace. Comme exemples d'espaces 
vectoriels isomorphes on peut considérer l’espace arithmétique à 
dimensions (réel ou complexe) et l’espace des polynômes de degré 
< n — 1 (à coefficients respectivement réels ou complexes) avec les 
opérations habituelles donnant la somme de deux polynômes et le 
produit d’un polynôme par un nombre (démontrez l’isomorphisme !). 

2. Dépendance linéaire. Les éléments x, y, . . ., w d’un espace 
vectoriel L sont dits linéairement dépendants, s’il existe des nombres 
&, B, ..., À, non tous nuls, tels que 


ax + By + ... + Aw — 0. (2) 


Dans le cas contraire ces éléments sont dits linéairement indépen- 
dants. Autrement dit, les éléments x, y, . .., w sont linéairement 


113 ESPACES VECTORIELS NORMÉS ET TOPOLOGIQUES [Ch. III 


indépendants, si l'égalité (2) implique les égalités 
a=$Bf—...—À—-t0(. 


Un système i n f i n i d'éléments x, y, . .. de l’espace vectoriel 
L est dit linéairement indépendant, si tout sous-système fini de ce 
système est linéairement indépendant. 

Si dans l’espace vectoriel ZL on peut trouver nr éléments linéaire- 
ment indépendants mais on ne peut pas trouver n + 1 éléments 
linéairement indépendants, on dit que l’espace L est de dimension n 
(ou à n dimensions). Si, par contre, dans Z on peut trouver un systè- 
me comportant. un nombre fini arbitraire d'éléments linéairement 
indépendants, on dit que l’espace ZL est de dimension infinie. On 
appelle base d’un espace vectoriel Z de dimension n tout système 
comportant nr éléments linéairement indépendants de cet espace. 
Il est aisé de vérifier que les espaces R? et C7 sont de dimension n, 
ce qui justifie leur dénomination. 

Dans le cours d’algèbre linéaire on n’étudie que des espaces 
vectoriels de dimension finie. Dans cet ouvrage au contraire, nous 
étudierons principalement des espaces de dimension infinie qui 
présentent le plus d'intérêt du point de vue de l’analyse. On propose 
au lecteur de vérifier que chacun des espaces vectoriels, indiqués 
aux exemples 3-8, est de dimension infinie. 

3. Sous-espaces vectoriels. Un sous-ensemble non vide L’ de 
l’espace vectoriel Z est appelé sous-espace vectoriel de L, s'il est 
lui-même un espace vectoriel par rapport aux opérations d’addition 
et de multiplication par un nombre, définies dans Z. 

Autrement dit, l’ensemble L’ & L est un sous-espace vectoriel, 
si de x € L’ et y € L’ il résulte que ax + By € L’, quels que soient 
les nombres & et f. 

Tout espace vectoriel L admet un sous-espace particulier dont le 
seul élément est l’élément nul de Z. D'autre part, l’espace ZL lui- 
même peut être considéré comme son sous-espace. Un sous-espace 
vectoriel, différent de Z et contenant au moins un élément non nul, 
est dit sous-espace propre de L. 

Considérons quelques exemples de sous-espaces vectoriels 
propres. 

1. Soit Z un espace vectoriel quelconque et soit x un élément non 
nul de Z. L'ensemble des produits {Az}, où À parcourt l’ensemble de 
tous les nombres (réels ou complexes) constitue, évidemment, un 
sous-espace vectoriel de dimension {. C’est un sous-espace propre 
de Z, si la dimension de ZL est supérieure à 1. 

2. Considérons l’espace vectoriel des fonctions continues C [a, b] 
(cf. exemple 3, n° 1), et dans cet espace l’ensemble des polynômes 
P La, b]. Il est clair que P [a, b] est un sous-espace vectoriel de C [a, b] 
(dont la dimension est, comme celle de C [a, b], infinie). Par ail- 
leurs, l’espace C [a, b] peut être considéré à son tour comme un sous- 
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espace de l’espace vectoriel plus vaste comportant toutes les fonc- 
tions (continues et non continues) définies sur [a, b]. 

3. Considérons, enfin, les espaces L, co, c, m et R° (exemples 4-8, 
n° 1). Il est aisé de voir que chacun d’eux est un sous-espace propre 
de son suivant. 

Soit {x,} un ensemble non vide quelconque d'éléments de l’es- 
pace vectoriel L. Alors, dans L il existe un sous-espace minimal (qui 
peut d’ailleurs coïncider avec L) contenant l’ensemble {x,}. En 
effet, il existe au moins un sous-espace vectoriel de Z contenant 
{x,}, par exemple, l’espace ZL lui-même. D'autre part, l'intersection 
de toute famille {L.,} de sous-espaces de L est un sous-espace de L. En 
effet, si L* = AN L, et x, y € L*, on a aussi ax + fy € L* quels 

Ÿ 
que soient æ& et B. Considérons maintenant tous les sous-espaces de 
L contenant le système {x,}. Leur intersection sera précisément le 
sous-espace minimal de Z contenant {x,}. Nous dirons que ce sous- 
espace est engendré par l’ensemble {x,} ou qu’il est l'enveloppe li- 
néaire de {x,}. Nous désignerons ce sous-espace par ZL ({x, }). 


Exercices. Un système linéairement indépendant {r,} d'éléments de 
l'espace vectoriel Z est dit base de Hamel, si son enveloppe linéaire coïncide 
avec Z. Démontrer les assertions suivantes: 

1) dans tout espace vectoriel il existe une base de Hamel. 

Indication. Utiliser le lemme de Zorn; 

2) si {r,} est une base de Hamel dans ZL, tout vecteur x € L peut être repré- 
senté de façon unique sous la forme d’une combinaison linéaire finie de vecteurs 
du système {x, }; 

3) deux bases de Hamel quelconques d'un espace vectoriel sont équipoten- 
tes ; la puissance d’une base de Hamel d’un espace vectoriel est appelée parfois 
dimension algébrique de cet espace; 

4) pour que deux espaces vectoriels soient isomorphes il faut et il suffit 
qu'ils aient la même dimension algébrique. 


4. Espaces quotients. Soient ZL un espace vectoriel et Z' un sous- 
espace quelconque de Z. Nous dirons que deux éléments x et y de L 
sont équivalents, si leur différence x — y appartient à L’. Cette rela- 
tion est réflexive, symétrique et transitive, de sorte qu’elle définit 
une partilion de Z en classes d'équivalence que l’on appelle encore 
classes de contiguité (suivant L'). L'ensemble de toutes ces classes 
s'appele espace quotient de L par L” et se note L/L'. 

Dans tout espace quotient on introduit de façon naturelle les 
opérations d’addition et de multiplication par un nombre. Plus 
précisément, soient & et n deux classes, c.-à-d. deux éléments de 
L'L". Choisissons dans chacune de ces classes un représentant quel- 
conque : soient x un représentant de Ë et y un représentant de n. 
Appelons somme des classes £ et n la classe & qui contient l’élément 
z + yet produit de la classe Ë par le nombre « la classe qui contient 
l'élément ax. Il est aisé de vérifier que le résultat ne change pas, 
si l’on remplace les représentants x et y des classes £ et n par deux 
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autres représentants x” et y” de ces mêmes classes. Ainsi, nous avons 
bien défini deux opérations linéaires sur les éléments de l’espace quo- 
tient L/L’. On vérifie aussitôt que ces opérations satisfont à toutes 
les conditions énumérées dans la définition de l’espace vectoriel 
(faites cette vérification !). En d’autres lermes, fout espace quotient 
L/L' (avec les opérations d’addition et de multiplication par un 
nombre définies ci-dessus) constitue un espace vectoriel. 

Si Z est un espace vectoriel de dimension nr et L’ est un sous- 
espace de L de dimension k, alors l’espace quotient L/L’ est de di- 
mension n — k (démontrer !). 

Soient Z un espace vectoriel arbitraire et Z’ un sous-espace quel- 
conque de Z. La dimension de l’espace quotient ZL/L' s'appelle 
codimension du sous-espace L’ par rapport à l’espace L. 

Si le sous-espace L’ € L est de codimension finie n, alors dans L 
on peut trouver nr éléments x, Zo, . .., æ, tels que tout élément 
x € L puisse être mis (de façon unique) sous la forme 


LT = As + + + Anln + Y, 
OÙ y, .- . ., & Sont des nombres et y € L’. En effet, supposons que 


l’espace quotient L/L' soit de dimension n. Considérons dans cet 
espace quotient une base 
61 69) . En 


et choisissons dans chaque classe £, un représentant x,. Soient maiïin- 
tenant x un élément arbitraire de L et £ la classe de L/L” qui le 
contient. On a alors 
6 — Obs + . .. + anên. 
Cela signifie, par définition, que tout élément de Ë, en particulier x, 
ne diffère de la même combinaison linéaire des éléments x,, . .. 
.., Zn Que par un élément de L”, c.-à-d. 
TZ = Ant + ee + Antn +y, yEL’ 

La démonstration de l’unicité de cette représentation est lais 
sée au lecteur. 

9. Fonctionnelles linéaires. Nous appellerons fonctionnelle toute 


fonction numérique f définie sur un espace vectoriel L. Une fonction- 
nelle f est dite additive, si 


f@œ+y) =f(@) +7), 
quels que soient x, y € L; elle est dite homogène, si pour tout x € L 
et pour tout nombre & on a 
f (ax) — af (x). 
Une fonctionnelle f, définie sur un espace vectoriel complexe, 


est dite semi-homogène, si f (ax) = af (x), où & désigne le nombre 
complexe conjugué de «. 
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Une fonctionnelle additive et homogène s’appelle fonctionnelle 
linéaire. Une fonctionnelle additive et semi-homogène est dite 
semi-linéaire. 

Considérons quelques exemples de fonctionnelles linéaires. 

1. Soit R? l’espace arithmétique à nr dimensions d'éléments 
x = (x, ..., n) el soit a — (a, . .., a,) un système de nr nom- 
bres fixés arbitrairement. Alors 


f{)= 2 dit; 


est une fonctionnelle linéaire sur KR. De même, 
n 
f()= 2 air 
i=1 
est une fonctionnelle semi-linéaire sur (C7. 
2. Les intégrales 


b 
Ia= | x (t) dt et Ta= | x (0) di 


représentent respectivement une fonctionnelle linéaire et une fonc- 
tionnelle semi-linéaire sur l’espace C [a, bl]. 

3. Considérons un exemple plus général. Soit y, une fonction 
continue sur [a, b] bien déterminée. Pour toute fonction x € C [a, b} 


posons 
b 


F (x)— | x (t) Yo (t) dt. 
La linéarité de cette fonctionnelle découle des propriétés fonda- 
mentales de l’intégration. La fonctionnelle 
b 
AO ETOPTOE 


a 


sera semi-linéaire (sur l’espace complexe C Îla, bl). 

4. Considérons sur le même espace C [a, b] une fonctionnelle 
linéaire d’un autre type. Plus précisément, posons pour toute fonc- 
tion x EC [a, b] 

Oto (X)—Z (to); 
de sorte que la valeur de la fonctionnelle 64, correspondant à la fonc- 
tion x coïncide avec la valeur de cette fonction en un point fixé #0. 
Cette fonctionnelle s'écrit d'habitude sous la forme 
b 
Ô, (x) — | x (4) 8(t— to) dt, 


a 
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où Ô désigne une « fonction », nulle partout, sauf pour £{ = 0, dont 
l'intégrale est égale à 1 (6-fonction de Dirac). Les « fonctions » 
de cette espèce sont définies rigoureusement dans le cadre de la théo- 
rie des distributions dont certains éléments seront exposés au $ 4 
du chapitre suivant. 

o. Considérons un exemple de fonctionnelle linéaire sur l’espace 
d,. Soit Æ un entier positif fixé quelconque. Pour tout élément 


Z = (Xy, ..., Tn +. .) 


de l’espace /; posons 
În (x) = xr. 


La linéarité de cette fonctionnelle est évidente. Ces fonctionnelles 
peuvent être « étendues » à d’autres espaces de suites numériques, 
par exemple, à co, c, m, R° (exemples 5-8, n° 1). 

6. Interprétation géométrique des fonctionnelles linéaires. Soit 
une fonctionnelle linéaire quelconque, non identiquement nulle, 
définie sur un espace vectoriel Z. L'ensemble des éléments x € L 
vérifiant la condition 

f (x) = 0 


constitue un sous-espace vectoriel de Z que l’on appelle sous-espace 
des zéros ou noyau de la fonctionnelle f. En effet, si f (x) = f (y) — 
— 0,ona 


j (ax + By) = af (x) + Bf (y) = 0. 


On désigne ce sous-espace par Ker f !). 

Le sous-espace Ker f est de codimension 1. En effet, considérons 
un élément quelconque x, n’appartenant pas à Ker f, c.-à-d. tel que 
Î (to) Æ 0. Un tel élément existe, étant donné que f (x) = 0. Sans 
restreindre la généralité on peut supposer f (x,) — 1, car dans le 


cas contraire on pourrait remplacer xo par Il est clair que 


_T0 ( 
f(xo)" 

Ï (2) —= 1.) Pour tout élément x posons y = x — f (x) x0; alors 
f(y)=f(x— f(x) zxo) = 0. c.-à-d. y € Ker f. La représentation de 
x sous la forme 


z = ax + y, y E Ker f, 
pour x, fixé est unique. En effet, soit 


T = AXo + y, y E Ker}f, 
x = &'xo + y’, y E Ker f. 


Alors 
(œ —&')zo = y — y. 


1) Du mot anglais kernel qui signifie noyau. 
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Il est clair que pour &« — x’ cette égalité donne y’ — y. Si, par 
contre, &« = &', On à Zo — Ê — € Ker f, ce qui est en contradiction 


— 


avec le choix de æo. 

On en déduit que deux éléments x, et x, appartiennent à la même 
classe de contiguïté suivant le sous-espace Ker f, si et seulement si 
f (x) = f (x2). En effet, de 


Xi = f (x:) Lo + Y1: 
Ta = (x) Lo À Y2 
il résulte que 


Zi — X2 = (f (xx) — f (t2)) <Xo + (Yi — 2), 


d’où l’on voit que x, — x2 € Ker F si et seulement si le coefficient 
de xo, C.-à-d. f(x) — f (x2), est égal à 0. 

Chaque classe Ë suivant le sous-espace Ker f est définie par un 
quelconque de ses représentants. Un tel représentant peut être choisi 
de la forme ax,. On voit alors que le sous-espace L/Ker jf est bien de 
dimension 1, c.-à-d. que Ker f est de codimension 1. 

La fonctionnelle linéaire s’annulant sur le sous-espace Ker f est 
déterminée par ce sous-espace à un facteur constant près. 

En effet, supposons que les fonctionnelles linéaires f et g aient 
le même noyau: Ker f — Ker g. Choisissons un élément x, de façon 
que f (to) — 1. Il est aisé de voir que g (xo) 5 0. Pour cela remar- 
quons que pour toutx € Lona 


z = f (x) ïo + y, y EKerf = Kerg 
g (x) = f (x) g (xo) + & (y) = f (x) & (to). 


Donc, si la valeur de g (xo) était nulle, la fonctionnelle g serait iden- 
tiquement nulle. L'égalité g (x) = g (xo) f (x) exprime la propor- 
tionnalité des fonctionnelles g et f. 

Pour tout sous-espace L” de codimension 1 on peut trouver une 
fonctionnelle f telle que Ker jf — L’. Il suffit de choisir un élément 
quelconque xo é L” et de représenter chaque élément x € L sous la 
forme x = «à xo + y. Une telle représentation est unique. En posant 
f (x) = «à nous obtiendrons une fonctionnelle linéaire f telle que 
Ker f — L' (vérifier !). 

Soit L’ un sous-espace quelconque de codimension 1 de l’espace 
vectoriel L; alors toute classe de contiguïté de l’espace L suivant 
le sous-espace L” est appelée hyperplan parallèle au sous-espace L’ 
(en particulier, le sous-espace L’ lui-même est un hyperplan conte- 
nant Ô, c.-à-d. « passant par l’origine »). Autrement dit, un hyper- 
plan M” parallèle au sous-espace L’ est un ensemble qui peut être 
obtenu de L’ par une translation de vecteur x, € L: 


M =L' + zo= {y:y=zx<+zro, x E L'} 


et 
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Il est clair que si x, € L’, on a M” — L'; par contre, si x 4 L”, 
alors M” = L’'. Si f est une fonctionnelle linéaire non triviale sur 
L, alors l’ensemble M} — {x : f (x) — 1} est un hyperplan parallèle 
au sous-espace Ker f (en effet, lorsqu'un élément x, est choisi de 
façon que f (xs) — 1, on peut représenter tout vecteur x € M}; sous. 
la forme x — x0 + y avec y € Kerf). D'autre part, M' étant un 
hyperplan quelconque parallèle au sous-espace L’ (de codimension 
1) el ne passant pas par l’origine, il existe une fonctionnelle linéaire: 
unique f telle que M° = {x :f(x) = 1}. En effet, soit M’ — 
— L' + xo, xo € L; alors tout élément x € L peut être représenté: 
de façon unique sous la forme x = axo + y, où y € L’. En posant, 
comme plus haut, f (x) — &«, on obtient la fonctionnelle linéaire: 
cherchée ; l’unicité résulte du fait que si g (x) = 1 pour x € M, 
alors g (y) = 0 pour y € L, de sorte que 


g (axo + y) = à = f (axo + y). 


Ainsi, nous avons établi une correspondance biunivoque entre toutes 
les fonctionnelles linéaires non triviales, définies sur l’espace vectoriel 
L, et tous les hyperplans de L ne passant pas par l’origine. 


Exercice. Soit f, f1, . .., f, des fonctionnelles linéaires sur l’espace 
vectoriel Z telles que f1 (x) = ... = f, (x) = 0 implique f (x) = 0. Alors il 
existe des constantes a, . . ., a, telles que 

ñn 
f(x)= Y aRfn (x) 


pour tous les x € Z. 


$ 2. Ensembles convexes et fonctionnelles convexes 
Théorème de Hahn-Banach 


1. Ensembles convexes et corps convexes. La notion de convexité: 
est à la base de nombreuses questions de la théorie des espaces vecto- 
riels. Elle est fondée sur des considérations géométriques intuitives, 
mais peut être formulée aussi en termes purement analytiques. 

Soit L un espace vectoriel r é e 1 et soient x, y deux points de 
cet espace. On appelle segment fermé joignant les points x et y dans 
L l’ensemble de tous les éléments de la forme 


ax ++ Py, a, BP >0, «à + B = 1. 


Un segment privé de ses extrémités x et y s’appelle segmeni 
oui;ert. 

Un ensemble M € L est dit convexe, si pour tout couple de 
points x, y € M, le segment joignant ces points est contenu dans M. 

On appelle noyau J (E) d'un ensemble £ € L l’ensemble des 
points x € E possédant la propriété suivante : pour tout point y € L, 
il existe un nombre & = € (y) >> 0 tel que x + ty € E pour |t | < &. 
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Un ensemble convexe dont le noyau n’est pas vide s’appelle 
corps convexe. 

Exemples. 1. Dans l’espace euclidien à trois dimensions le 
cube, la boule, le tétraèdre, le demi-espace sont des corps convexes. 
Dans le même espace le segment, le plan, le triangle sont des ensem- 
bles convexes, mais non des corps convexes. 

2. Considérons dans l’espace des fonctions continues sur le seg- 
ment [a, b] l’ensemble des fonctions vérifiant la condition 


IfOI<T. 
Cet ensemble est convexe ; en effet, si 
[fGI<Tet [gHI<1, 
alors, pour a +B—=1,a, Bf>0,ona 
[af (t) + Br I<a+$—= T1. 
Exercice. Vérifier, si cet ensemble est un corps convexe. 
3. La boule unité dans !,, c.-à-d. l’ensemble des points x — 


= (x, ..., Æn, . . .) tels que >x° < 1, est un corps convexe. Son 


noyau est constitué par les points x vérifiant la condition dx? < 1. 
4. Le parallélépipède fondamental II dans /, est un ensemble 
convexe, mais non un Corps convexe. En effet, soit x € II; cela si- 


gnifie que |x, <= pour tous les n = 1, 2, ... Posons yo — 

À 1 . \ l { 
— (1, LÉ . PL . .). Soit x + lo € IT, c.-à-d. | Ta + « << Sn ? 
alors 


1 1 1 
En] en gr + er = gr 


d'où { — 0 et, donc, le noyau de l’ensemble IT est vide. 


n 


< 


Exercice. Soit ® l’ensemble des points x = (2, ..., r,, ...) de 
l'espace l: vérifiant la condition >» n?x? < 1. Démontrer que ® est un ensemble 
convexe, mais n’est pas un corps convexe. 


Si M est un ensemble convexe, son noyau J (M) est aussi con- 
vexe. En eïtet, soient x, y € J (M) et z = ax + By, a, B >0, 
& + B = 1. Alors pour a € L donné on peut trouver deux nombres 
e, > 0 et &o > 0 tels que pour | 4 |  &, et | fo | € les points 
z + ta el y + a appartiennent à l’ensemble M; par consé- 
quent, si [é|<e— min (&, €); le point œ(x + ta) + 
+ BP (y + ia) = z + la appartient aussi à M, c.-à-d. z € J (M). 

Nous allons établir maintenant une propriété importante des 
ensembles convexes. 


Théorème 1. L'intersection de toute famille d'ensembles 
convexes est un ensemble convexe. 
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Démonstration. Soit M — NM,, tous les ensembles M, 
œ 


étant convexes. Soient, d'autre part, x et y deux points quelconques 
de M. Le segment joignant ces points appartient à chacun des ensem- 
bles M,, donc à M. Par conséquent, M est bien un ensemble con- 
vexe. 

Remarquons que l'intersection des corps convexes (qui constitue 
un ensemble convexe) n’est pas nécessairement un c o r ps convexe 
(donner un exemple). 

Pour tout ensemble À d’un espace vectoriel L il existe un plus 
petit ensemble convexe qui le contient, c’est l’intersection de tous 
les ensembles convexes contenant À (il existe toujours au moins un 
ensemble convexe contenant À ; par exemple, l’espace ZL tout entier). 
Le plus petit ensemble convexe contenant À s’appelle enveloppe 
convexe de l’ensemble À. 

Considérons un exemple important d’enveloppe convexe. Soient 


Li Los + + +; Ln+1 des points d’un espace vectoriel quelconque. Nous 
dirons que ces points sont indépendants, si les vecteurs xz2 — 1, 
Lg — Lys, + + +, Ent — Xy SOnt linéairement indépendants. (Cela 
équivaut à dire que les relations 

n+i n+1 


> Aix; 0 et > À; —0 
i=1 i=1 


impliquent 

A1—= 0 — CR «= Àn4—= 0.) 
L’enveloppe cunvexe des points indépendants y, Zo, . . ., Æn+s 
s’appelle simplexe de dimension n ; les points x,, Ze, . . ., Z,+, sont 


appelés sommets du simplexe. Un simplexe de dimension 0 est un 
point. Un simplexe de dimension 1 est un segment, un simplexe de 
dimension 2 est un triangle, un simplexe de dimension 3 est un 
tétraèdre. 

Si les points æy, Lo, - . ., Æn+1 Sont indépendants, il en est de 
même pour n'importe quels 4 + 1 d’eux (4 n); ces derniers en- 
gendrent donc un simplexe de dimension Æ que l’on appelle face de 
dimension k du simplexe engendré par les n points donnés. Par exem- 
ple, un tétraèdre de sommets e,, 62, e,, e, a quatre faces de dimension 
2, définies respectivement par les triplets de sommets (e», e3, e:), 
(e1, ea, ex), (er, Eos Eu), (1, 62, €2) ; il a six faces de dimension 1 (arêtes) 
et quatre faces de dimension 0 (sommets). 


Théorème 2. Le simplexe de sommets x,, xs, . . ., Xn+s 
est l’ensemble de tous les points qui peuvent être mis sous la forme 
n+1 n+1 


TZ —= > Aplr, AO, », a —=1. (1} 
k k=1 


— À = 
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Démonstration. Il est aisé de vérifier que l’ensemble S 
des points de la forme (1) constitue un ensemble convexe contenant 
les points Z4, Lo, . . ., Æn+1. D'autre part, tout ensemble convexe 
contenant ces points, contient nécessairement les points de la for- 
me (1). Par conséquent, S est le plus petit ensemble convexe conte- 
nant les points 24, Lo, . . ., Æn+4. 

2. Fonctionnelles convexes. La notion d'ensemble convexe est 
étroitement liée avec la notion importante defonctionnelle 
convexe. 

Définition. Une fonctionnelle non négative p, définie sur 
un espace vectoriel réel L, est dite convexe, si 

1) p(& + y) < p (x) + p (y), quels que soient x, yEL; 

2) p (ax) = ap (x), quels que soient x € L et a > 0. 

Nous n’exigeons pas que la valeur de p (x) soit finie pour tous 
les x € L; autrement dit, nous admettons que pour certains x € L 
on peut avoir p (x) — + oo. 

Considérons quelques exemples de fonctionnelles convexes. 

4. La longueur d’un vecteur dans l’espace euclidien à r dimen- 
sions R?. Ici la première condition signifie que la longueur de la 
somme de deux vecteurs est inférieure ou égale à la somme de leurs 
longueurs (inégalité triangulaire); quant à la seconde, elle résulte 
immédiatement de la définition de la longueur d’un vecteur dans R?. 

2. Soit M l’espace des fonctions bornées x sur un ensemble quel- 
conque $ et soit s, un point fixe de $S. Alors 


Pso (x)==] x (s0) | 


est une fonctionnelle convexe. 
3. ooit m l'espace des suites numériques bornées x — 
— (t,, Lo, - . ., An, . : .). La fonctionnelle 


p(x)=sup |; | 
ñn 
est convexe. 
3. Fonctionnelle de Minkowski. Etudions la liaison existant entre 


les fonctionnelles convexes et les ensembles convexes. 
Théorème 3. Si p est .une fonctionnelle convexe sur l’espace 


vectoriel L et k est un nombre positif, l’ensemble 
E = {z:p (x) <k} 


est convexe. Si la fonctionnelle p est partout finie, alors E est un corps 
convexe ayant pour noyau l’ensemble 


{z:p(x) <k} 
(contenant nécessairement le point 0). 


Démonstration. Six, yEE£ et a+f$—=1, «à, pf > 0, 


alors 
p (ax + By) < ap (x) + Pr (y) <k, 
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c.-à-d. Æ est un ensemble convexe. Supposons maintenant la fonc- 
tionnelle p finie, p (x) < k; alors pour {> 0etyE£ELona 


p @ + ty) < p (x) + tp (+y). 


Si p (—y) = p (y) = 0, on a x+tyEeE pour tous les t{; si, par 
contre, au moins l’un des nombres non négatifs p (y), p (—y) est 
différent de 0, on a x+ty€CE pour 


k—p(x) 
ASE TITI IT ET) EE 


Choisissons une valeur bien déterminée de k, par exemple, 4 = 1. 
Alors toute fonctionnelle convexe finie p définit de façon unique 
dans ZL un corps convexe E — {x:p (x) <1} tel que 0 € J (E). Inver- 
sement, soit Æ£ un corps convexe dont le noyau contient le point 0. 
Alors 


s(a)=inf {ri LEE, r>0} (2) 


est une fonctionnelle convexe finie. On l’appelle fonctionnelle de 
Minkowski pour le corps convexe £. 
Monirons que la fonctionnelle de Minkowski (2) est convexe. 


Pour tout x € L l'élément — appartient à £, si r est assez grand ; donc, 
— àPP 8 


la valeur de px (x), définie par l'égalité (2), est non négative et 
finie. Sit—Oely —tx,;ona 


Pr(pÿ=inf{r>0:Ler}=inf{r>0: Ter) 
=inf {> 0:HEE}=tint fr >O0:LEE }—tpr (a). (3) 


Soient maintenant x, Ze E L et e = O0 quelconque. Choisissons 
les nombres r; (i — 1, 2) de façon que pg (x;) <r; pp (x;) +E; 


Ti . T TZ rit To 

alors 7 € E. Posons r = r; + r,;; alors le point TPS MM, Tate 
r Tr TTo 

appartient au segment d’extrémités met . En vertu de la conve- 


xité de Æ, ce segment est contenu dans E° en particulier, son point 


Are appartient à £. Par conséquent, 


Pe (+ x) Lr = Tr + re pr (ti) + Pr (X2) + 2e. 
Le nombre £& >> 0 étant arbitraire, on a 


PE (di + 22) < Pre (ti) + Pre (2). (4) 


Les relations (3) et (4) signifient précisément que la fonctionnelle 
pe (x) est convexe. 
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Si £ est un ensemble convexe contenant le point O0, alors l’éga- 
lité (2) définit une fonctionnelle px (x) convexe, mais non nécessai- 
rement finie. 


Exercice. Un ensemble À de l’espace vectoriel L est dit absorbant, 
si pour tout x € L il existe un nombre & >> 0 tel que x € ÀA pour tous les À > «. 
Démontrer qu’un ensemble convexe À est absorbant si et seulement si la fonc- 
tionnelle de Minkowski pour cet ensemble est finie. 


4. Théorème de Hahn-Banach. Soient L un espace vectoriel réel 
et L, un sous-espace quelconque de L. Soit, en outre, f, une fonction- 
nelle linéaire définie sur le sous-espace L,. Une fonctionnelle f, 
définie sur l’espace L tout entier, est appelée prolongement de la 
fonctionnelle f,, si 


f (x) = fo (x) pour tous les x € L, 


Le problème du prolongement d’une fonctionnelle se présente 
fréquemment en analyse. Le rôle fondamental dans toutes ces ques- 
tions appartient au théorème suivant. 


Théorème 4 (de Hahn-Banacbh)}). Soit p une fonc- 
tionnelle convexe finie, définie sur l’espace vectoriel réel L, et soit L, 
un sous-espace vectoriel de L. Si f, est une fonctionnelle linéaire sur 
Lo, majorée (sur L;) par la fonctionnelle p (x), c.-à-d. si pour tout 
T € Lo on «a 

fo (x) < p (x), (5) 


alors fo peut être prolongée de façon à obtenir une fonctionnelle li- 
néaire f sur L, majorée par p (x) partout sur L. 


Démonstration. Montrons que si L, = L, la fonction- 
nelle /, peut être prolongée à un sous-espace L’, plus vaste que L,, 
tout en respectant la condition (5). En effet, soit z un élément quel- 
conque de Z n’appartenant pas à L, et soit L’ le sous-espace engen- 
dré par L, et z. Chaque élément de L’ est de la forme 


1z+zx,où x EL, 
Si f’ est le prolongement cherché de la fonctionnelle f, à L',ona 
f Gz + x) = 1f (2) + fo (x) 
ou, si l’on pose f” (z) = c, 
J(Cz+ ax) = te + fo (x). 


Choisissons maintenant c de façon que la condition de majoration (5) 


soit conservée sur L”, c.-à-d. de façon que pour tous les x € L, et tous 
les { réels on ait l’inégalité 


fo (x) + ic < p (x + t2). 


9—0167 
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Pour {> 0 cette inégalité équivaut à la condition 
h(+)+e<p(<+z) où c<p(F+:)—H(+), (6) 


pout << 0 elle est quivarente à la condition 


ou 
“A 


LT Lari 

te du (+) . (7) 

Montrons qu'il existe toujours un nombre c satisfaisant à ces deux 
conditions. Soient y’ et y” deux éléments arbitraires de Z,. Alors 


— fo (y) + p (y +2) > — fo(y')— p(— y —2). (8) 
Ceci résulte de l'inégalité 
fo(y")— fo (y) P(y —y')= 
= p((y"+z)— (y +2) <P(Y +2) + p(—y —2). 
Posons 


c"— ini (— fo(y")+ p (y'—+-2)), 
c' = sup (— fo (y')— p(—y"—2)). 


Comme les éléments y” et y” sont arbitraires, de (8) il résulte que 
c” > c’. En choisissant c de façon que 


LCL”, 
définissons la fonctionnelle jf” sur L’ par la formule 
f(z + x) = te + fo (x). 


Cette fonctionnelle satisfait à la condition de majoration (5). 

Ainsi, nous avons montré que si une fonctionnelle f, est définie 
sur un sous-espace L, © L et vérifie sur L, la condition (9), elle 
peut être prolongée à un sous-espace plus grand L” de façon que la 
condition (5) soit conservée. 

Si dans Z on peut choisir un système dénombrable d'éléments 
Li, Lo, + + + En, - « . engendrant l’espace L tout entier, on consiruil 
la fonctionnelle sur L par récurrence, en considérant la suite de 
sous-espaces 

LD = {Lo, di}, L® = {LA, vo}, 


(ici {L®, Th+1} désigne le plus petit sous-espace vectoriel de ZL 
contenant L® et x,:,). Comme tout élément x € L se trouve alors 
dans un sous-espace Z®, la fonctionnelle f, sera prolongée à l’espace 
L tout entier. 
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Dans le cas général (c.-à-d. lorsqu'il est impossible de trouver 
un ensemble dénombrable d'éléments engendrant l’espace L) la 
démonstration fait appel au lemme de Zorn. L'ensemble % de tous 
les prolongements de la fonctionnelle fs, vérifiant la condition (5), 
est ordonné, et tout sous-ensemble totalement ordonné %o € % 
possède une borne supérieure. Cette borne supérieure n’est autre 
chose que la fonctionnelle définie sur la réunion des domaines de 
définition des fonctionnelles f” € #0 et coïncidant avec chacune de 
ces fonctionnelles f” sur son domaine de définition. En vertu du lem- 
me de Zorn, l’ensemble % possède un élément maximal f. Cet élé- 
ment maximal f est précisément la fonctionnelle cherchée. En effet, 
elle est un prolongement de la fonctionnelle initiale f,, vérifie la 
condition (5) et est définie sur tout l’espace L, car sinon nous l’au- 
rions prolongée de la manière indiquée ci-dessus à un sous-espace 
plus grand que le sous-espace propre sur lequel elle est définie, de 
sorte que f ne serait pas un élément maximal de %. 

Le théorème est démontré. 

Considérons maintenant le théorème de Hahn-Banach pour le 
cas d’un espace vectoriel complexe. 

Une fonctionnelle non négative p, définie sur l’espace vectoriel 
complexe L, est appelée convexe, si pour tous les x, y € Let 
tous les nombres complexes À on a 


p&+y)<p (x) + p (y), p (x) = |A |p (x). 


Théorème 4a. Soit p une fonctionnelle convexe finie sur 
l’espace vectoriel complexe L et soit f, une fonctionnelle linéaire, déji- 
nie sur un sous-espace vectoriel quelconque L, € L et vérifiant sur ce 
sous-espace la condition 


| fo (x) | L p (x), x € Lo. 


Alors il existe une fonctionnelle linéaire f, définie sur tout l’espace L 
et vérifiant les conditions 


[f&@I<pP(G), xELZ, 
Ï (@) = fo (&), & € Lo 


Démonstration. Désignons par LA et Lor les espaces L 
et L, considérés comme espaces vectoriels réels. Il est clair que p 
est une fonctionnelle convexe finie sur LR et for (x) — Re f, (x) est 
une fonctionnelle linéaire réelle sur LR vérifiant la condition 


| for (x) | P (x) 


et, à plus forte raison, la condition 


for (x) p (x). 
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D'après le théorème 4, il existe une fonctionnelle linéaire réelle f BR: 
Ld Q Q Ÿ Q Q 0 Q 
définie sur tout l’espace LA et satisfaisant aux conditions 


Jr(x)<p(x), xELr(=L), 
f(x) = for (x), xE Lor(= Lo). 
I est clair que —f8 (x) = fr (—x) < p (—x) = p (x), si bien que 
fr) Ip (x), x € La (=D). (9) 
Définissons une fonctionnelle f sur L, en posant 
f(x) = fr (&) — ifr (ix) 


(ici nous utilisons le fait que L est un espace vectoriel comple- 
xe et donc dans cet espace la multiplication par un nombre com- 
plexe est définie). On vérifie aussitôt que f est une fonctionnelle 
linéaire complexe sur L telle que 


f (æ) = fo (x) pour x € Lo, 
Re f (x) = fr (x) pour x € L. 


Il reste à montrer que | f (x) | < p (x) pour tous les x € L. Sup- 
posons le contraire; alors pour un certain x, € L'on à |f (xo) | >> 
> p (to). Mettons le nombre complexe f (x,) sous la forme f (xo) — 
— pe avec p >> 0 et posons yo = ex. Alors on a 


fr (Yo) = Re f (yo) = Re [ef (xo)] = p > p (to) — P (Yo). 


ce qui contredit la condition (9). 
Le théorème est démontré. 


Exercice. Montrer que dans le théorème de Hahn-Banach on peut 
omettre la condition que la fonctionnelle p soit finie. 


5. Séparation des ensembles convexes dans un espace vectoriel. 
Soient Z un espace vectoriel réel et M, N deux sous-ensembles de 
L. On dit qu’une fonctionnelle linéaire f, définie sur L, sépare ces 
deux ensembles, s’il existe un nombre C tel que 


f(x) >C pour xEMet f(x) LC pour zE N. 


Les deux assertions qui suivent sont des conséquences immédiates 
de cette définition. 

1) La fonctionnelle linéaire jf sépare les ensembles M et NW si et 
seulement si elle sépare les ensembles M — N et {0} (c.-à-d. l’en- 
semble de tous les éléments de la forme x — y aveczx EM,yE€Met 
le point 0). 

2) La fonctionnelle linéaire f sépare les ensembles M et N si et 
seulement si pour tout x € L elle sépare les ensembles M — x et 


N — x. 
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Du théorème de Hahn-Banach on obtient facilement le théorème 
suivant sur la séparation des ensembles convexes dans un espace 
vectoriel qui admet de nombreuses applications. 


Théorème 5. Soient M et N deux ensembles convexes dis- 
joints dans un espace vectoriel réel L. Si au moins l’un d'eux, par exem- 
ple M, possède un noyau non vide (c.-à-d. est un corps convexe), il cxis- 
te une fonctionnelle linéaire non nulle f définie sur L qui sépare M 
et N. 


Démonstration. Sans restreindre la généralité on peut 
supposer que le point 0 appartient au noyau de l’ensemble M. (Dans 
le cas contraire on aurait considéré les ensembles M — x, et N — x, 
où x, est un point quelconque du noyau de M.) Soit yo un point 
quelconque de l’ensemble W ; alors le point —y, appartient au noyau 
de l’ensemble  — N et O appartient au noyau de l’ensemble À — 
— M — N + yo. Les ensembles M et N étant disjoints, on a 0 4 
éM — Net y56 K. Soil p la fonctionnelle de Minkowski pour 
l'ensemble X. Alors p (yo) > 1 (car yo 6 K). Introduisons la fonc- 
tionnelle linéaire 

fo (&yo) = &p (Yo). 


Elle est définie sur le sous-espace de dimension 1, constitué des élé- 
ments de la forme ays, et vérifie la condition 


fo (&yo) < p (ayYo); 


car p(@yo) = ap (yo) pour à« 0 et fo (ayo) = àfo Yo) < 0 < 
<< p (ay) pour « << 0. D'après le théorème de Hahn-Banach, la 
fonctionnelle f, peut être prolongée de façon à obtenir une fonction- 
nelle linéaire f, définie sur tout l’espace L et vérifiant sur Z la con- 
dition f (y) < p (y). On en déduit que jf (y) < 1 pour y € K et, en 
même temps, f (yo) > 1. Ainsi, la fonctionnelle f sépare les ensem- 
bles Æ et {y,} et donc les ensembles M — N et {0}; par conséquent, 
f sépare les ensembles M et N. 

Le théorème est démontré. 


$ 3. Espaces normés 


Au chapitre II nous nous sommes occupés de l’étude des espaces 
topologiques et, en particulier, des espaces métriques, c.-à-d. des 
ensembles pour les éléments desquels, est définie d’une façon ou 
d’une autre la notion de proximité. Ensuite, dans les premiers para- 
graphes de ce chapitre, nous avons abordé l’étude des espaces vecto- 
riels. Jusqu'ici ces notions étaient considérées séparément. Cepen- 
dant, en analyse on est souvent amené à considérer des espaces munis 
non seulement des opérations d’addition et de multiplication par un 
nombre, mais en même temps d'une topologie, c.-à-d. des espa- 
ces vectoriels topologiques. Parmi ces derniers 
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une classe importante est constituée par lesespaces normés. 
La théorie de ces espaces a été développée dans les travaux de S. Ba- 
nach et de nombreux autres auteurs. 

1. Définition et exemples d'espaces normés. 

Définition 1. Soit L un espace vectoriel. La fonclionnelle 
convexe finie p, définie sur L, s'appelle norme, si (en dehors de la 
convexité) elle satisfait aux conditions supplémentaires suivantes: 

1) p (x) — 0 seulement pour x — 0, 

2) p (ax) = | a | p(x) pour tout «a. 

Ainsi, donc, en se rappelant la définition de la convexité, on 
peut dire qu’on appelle norme sur Z une fonctionnelle finie qui sa- 
tisfait aux trois conditions suivantes : 

1) px) 0, l'égalité p (x) — O0 ayant lieu seulement pour 
x = 0, 
2) px +y)<p(x)  +p(y), x yE L, 

3) p(ax) = |æ | p(x), quel que soit le nombre «. 

Définition 2. L'espace vectoriel L muni d’une norme 
s'appelle espace normé. On note la norme d’un élément x € L par le 
symbole || x ||. 

Tout espace normé peut être considéré comme un espace métri- 
que muni de la distance 


p (x, y) = | x — y ||. 


La vérité des axiomes de l’espace métrique résulte aussitôt des pro- 
priétés 1)-3) de la norme. Ainsi, toutes les notions et tous les résul- 
tats, exposés au chap. IT pour les espaces métriques, s'étendent aux 
espaces normés. 

Un espace normé complet s'appelle espace de Banach ou, plus 
brièvement, B-espace. 

Exemples d'espaces normés. Beaucoup d'espaces 
considérés au chap. II comme exemples d'espaces métriques (et au 
$ 1 de ce chapitre comme exemples d'espaces vectoriels) peuvent 
être en fait munis d’une structure naturelle d'espace normé. 

1. La droite R! devient un espace normé, si pour tout x € R! 
on pose [x|| = |x |. 

2. Si dans l’espace réel à nr dimensions R”° d'éléments 


X — (X,, Lo, +. +, Xn) 


xl = V 2 x, (1) 


tous les axiomes de la norme sont satisfaits. La formule 


pa p=lz—yl|- V > (tx — y) 


on pose 


$ 3] ESPACES NORMÉS 135 


définit sur R° la même métrique que nous avons déjà considérée 
sur cel espace. 
Dans ce même espace vectoriel on peut introduire la norme 


n 


IEA = 2 | za | (2) 


ou encore la norme 
|xio = max |zx;|. (3) 
1<R<N 
Ces normes définissent sur R des métriques que nous avons déjà 
considérées dans les exemples 4 et 5, n° 1, $ 1, chap. II. La véri- 
fication du fait que dans chacun de ces cas les axiomes de la norme 
sont vérifiés ne présente aucune difficulté. 
Dans l’espace complexe à n dimensions C” on peut introduire 


la norme 
n 
: 
lel=V DRE: 
k=1 


ou l’une quelconque des normes (2) et (3). 
3. Dans l’espace C [a, b] des fonctions continues sur le segment 
[a, b] introduisons une norme par la formule 


#1] = max | f G) |. (4) 


La distance correspondante a été déjà considérée dans l’exemple 6, 
n° 4, $ 1, chap. II. 
4. Soit m l’espace des suites numériques bornées 


TL — (x, Lo, CT Ln) . .). 
Posons 


xl =supl al (5) 


Les conditions 1)-3) figurant dans la définition de la norme sont 
évidemment vérifiées ici. La métrique induite dans m par cette nor- 
me coïncide avec celle que nous avons déjà considérée (chap. Il, 
$ 1, n° 1, exemple 9). 


2. Sous-espaces d’un espace normé. Nous avons appelé sous- 
espace d’un espace vectoriel Z (non muni de topologie) tout sous- 
ensemble non vide L, & L tel que si x, y € Lo, on à ax + By € Ls. 
Dans le cas d’un espace normé le plus d’intérêt présentent les sous- 
espaces vectoriels fermés, c.-à-d. les sous-espaces contenant tous leurs 
points d’accumulation. Dans un espace normé de dimension finie 
tout sous-espace esL nécessairement fermé (démontrer!). Dans le 
cas d’un espace de dimension infinie il n’en est pas de même. Par 
exemple, dans l’espace C [a, b] des fonctions continues sur [a, bl], 


136 ESPACES VECTORIELS NORMÉS ET TOPOLOGIQUES [Ch. II] 


muni de la norme (4), les polynômes forment un sous-espace qui 
n’est pas fermé !). 

Un autre exemple: dans l’espace m des suites numériques bor- 
nées, les suites ne contenant qu’un nombre fini de termes non nuls 
forment un sous-espace. Pourtant, ce sous-espace n’est pas fermé 
pour la norme (5), car sa fermeture contient, par exemple, la suite 


Dans la plupart des cas nous allons nous borner aux sous-espaces 
fermés ; c’est pourquoi il est naturel de changer la terminologie que 
nous avons adoptée au $ 1. Désormais nous appellerons sous-espaces 
d’un espace normé seulement ses sous-espaces fermés; en particu- 
lier, nous appellerons sous-espace engendré par un système donné 
d'éléments {x, } le plus petit des sous-espaces fermés contenant {x, }. 
Nous dirons aussi que ce sous-espace est la fermeture linéaire du 
système {x,}. L'ensemble (non fermé) d'éléments, qui possède la 
propriété de contenir en même temps que deux éléments x et y toute 
combinaison linéaire ax + y de ces éléments, sera appelé variété 
linéaire. 

Nous dirons qu’un système d'éléments appartenant à un espace 
normé Æ est complet, si le sous-espace (fermé!) qu’il engendre coïn- 
cide avec Æ£. Par exemple, en vertu du théorème de Weierstrass, le 
système des fonctions 4, #, £?, ..., £", ... est complet dans l’es- 
pace des fonctions continues C [a, b]. 


Exercices. 1. Soient R un espace de Banach et B,= B>=...7 
> B, = ... une suite de boules fermées emboîtées dans R. Démontrer que cette 
suite a une intersection non vide (on n’exige pas que les rayons de ces boules 
tendent vers 0; cîÎ. exercice 3, page 64). Donner un exemple de suite d’ensembles 
non vides emboîtés qui soient tous convexes, fermés et bornés et dont l’intersec- 
tion soit vide. 

2. Soit R un B-espace de dimension infinie. Montrer que sa dimension algé- 
brique (cf. exercice 3, page 119) est non dénombrable. 

3. Soient R un espace de Banach et M un sous-espace fermé de R. Considé- 
rons l’espace quotient P — R/M et introduisons dans cet espace une norme, en 
posant pour chaque classe de contiguité E 

IE l=inf|| x ||. 
XEE 


Démontrer que la fonctionnelle ainsi définie est bien une norme sur P et que 
l’espace P est complet pour cette norme. 

4. Soit À un espace vectoriel normé:; démontrer les assertions suivantes : 

1) toute variété linéaire de dimension finie dans R est fermée; 

2) M et N étant respectivement un sous-espace quelconque et un sous- 
espace de dimension finie dans À, leur somme 


M+LN={rz-=y<+z, yEM,z2CEN} 
1) En vertu du théorème de Weierstrass qui dit que toute fonction continue 


sur un segment est la limite d’une suite uniformément convergente de polynômes, 
la fermeture du sous-espace des polynômes dans C [a, b] coïncide avec C [a, b]. 
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est un sous-espace vectoriel (donc, M + N est fermé!) ; donner un exemple de 
deux sous-espaces vectoriels dans Z; dont la somme ne soit pas fermée ; 

3) soit Q un ensemble convexe ouvert dans R et soit zo é Q; alors il existe 
un hyperplan fermé passant par le point x, et n'ayant avec Q aucun point 


commun. 
». Deux normes || « | et ||-|b, définies sur l’espace vectoriel RÀ, sont dites 


équivalentes, s’il existe deux constantes a, b >= 0 telles que a ||z || < IFACES 
< b ||x |], pour tous les x € À. Démontrer que si |? espace R est de dimension 
finie, n'importe quelles deux normes sur À sont équivalentes. 


$ 4 Espaces euclidiens 


1. Définition d'un espace euclidien. Une méthode bien connue 
de définition de la norme sur un espace vectoriel consiste à définir 
sur cet espace un produit scalaire. Rappelons qu’on appelle produit 
scalaire sur un espace vectoriel réel R une fonction réelle (x, y), défi- 
nie pour tout couple d'éléments x, y € R et satisfaisant aux condi- 
tions suivantes : 

1) (x, y) = (y, x), 

2 (ti + Lo, y) = (rs, y) + (ra, y), 

3) (x, y) = À (x, y), 
4) (x, x) > 0, l'égalité (x, x) — O0 ayant lieu seulement pour 
x = (. 

Un espace vectoriel muni d’un produit scalaire s'appelle espace 
euclidien. Dans un espace euclidien R on introduit une norme par la 
formule 


Des propriétés 1)-4) du produit scalaire il résulte que tous les axio- 
mes de la norme sont vérifiés. 

En effet, les axiomes 1) et 3) de la norme (n° 1, $ 3) sont évi- 
dents; en ce qui concerne l’axiome 2) (inégalité triangulaire), il 
résulte de l'inégalité de Cauchy-Bouniakovsky 


LG, y) 1<]zl: [vi (1) 


que nous nous proposons de démontrer. 
Soit À un nombre réel arbitraire. Posons 


PO) = Qx + y, Az + y) = M (x, z) + 2X (à, y) + G, y) — 
= cl +26, yA+fyl. 


Remarquons que celte expression est un trinôme du second degré en 
À. Comme elle représente en même temps le carré scalaire d'un vec- 
teur, on a toujours f (À) >0. Par conséquent, le discriminant de ce 
trinôme ne peut être que négatif ou nul. C’est précisément ce fait 
qu'exprime l'inégalité de Cauchy-Bouniakovsky (1). 

Notons que dans un espace euclidien l'addition, la multiplica- 
tion par un nombre et la multiplication scalaire sont des opérations 
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continues ; plus précisément, si æ, — x, yn — y (au sens de la con- 
vergence en norme) et À, — À (comme une suite numérique), alors 


Tn Un > L + Y, 
Ann — ÀX, 


(Æns Yn) —+ (x, y). 


La démonstration de ces faits est basée sur l’utilisation de l’iné- 
galité de Cauchy-Bouniakovsky (1); on la laisse au lecteur à titre 
d'exercice. 

La présence du produit scalaire dans R permet de définir non 
seulement la norme (c.-à-d. la longueur) d’un vecteur, mais aussi 
l’angle de deux vecteurs; plus précisément, l'angle @ de deux vec- 
teurs x et y est défini par la formule 

. nm _& Y) 
F1 FETE 2) 
En vertu de l’inégalité de Cauchy-Bouniakovsky (1) le second mem- 
bre de l’égalité (2) a la valeur absolue inférieure ou égale à 1, de 
sorte que la formule (2) définit bien un angle , 0 < @ < x, quels 
que soient les vecteurs non nuls x el y. 


Si (x, y) = 0, de la formule (2) on obtient q@ — 5: dans ce cas 
les vecteurs x et y sont dits orthogonaux. 
Un système de vecteurs non nuls {x,} de R est dit orthogo- 
nal, si 
(ta, tp) = O0 pour à = f. 
Si les vecteurs du système {x,} sont orthogonaux, alors ils sont li- 
néairement indépendants. En effet, soit 


dits + AT oo + .….. —Lantan — 0 ; 
comme le système. {x, } est orthogonal, on a 
(Ta; Mila + ++. Antan) = (Las Ta) = 0; 
or, (Ta: Ta) Æ 0, d'où a; = 0 pour tous les i — 1,2, ...,n. 
Si un système orthogonal {x,} est complet (c.-à-d. si le plus petit 
sous-espace fermé qui le contient coïncide avec R), on l'appelle 
base orthogonale. Si, en outre, la norme de chaque élément est égale 


à 1, le système {x,} est appelé base orthonormée. En général, tout 
système {x,} (complet ou non) tel que 


O0 pour a -Æf, 
(To 2 = | 


1 pour aœ—=$f 
s'appelle système orthonormé. Il est clair que si {x,} est un système 


orthogonal, alors { “a 
IEZAL 


} est un système orthonormé. 
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2. Exemples. Considérons quelques exemples d'espaces euclidiens 
el de bases orthogonales dans ces espaces. 

1. L'espace artihmétique à nr dimensions R° dont les éléments 
sont des systèmes de nombres réels 


TL — (xs, To, ec.) Tn); 


muni des opérations habiluelles d’addition et multiplication par 
un nombre et du produit scalaire 


(x, y) = Drii (3) 


représente un exemple bien connu d'espace euclidien. Dans cet 
espace les vecteurs 


forment une base orthonormée (l’une d'une infinité possible). 
2. L'espace l, d'éléments 


O0 
x == (X1, Toy +. An) ...)s Z'a<o, 
i— 


muni du produit scalaire 
CZ y)= 2 Ti () 
1— 


est un espace euclidien. En effet, la convergence de la série figurant 
au second membre de (4) résulte de l'inégalité (4), chap. II, $ 1. 
Les propriétés 1)-4) du produit scalaire sont immédiates. La base 
orthonormée la plus simple dans /, est formée par les vecteurs 


€ — (0, {, 0, . ), 


e3 —= (0, 0, 1, ...), 


e = (1, 0, 0,...), 
| G) 


L’orthonormalité de ce système est évidente. De plus, le système (5) 


est complet. En effet, soient x = (x,, z2, . . ., &h, . . .) un vecteur 
arbitraire de Lo et 2x = (x, Zo, . . ., æ&n, O0, 0, . ..). Alors x 
est une combinaison linéaire des vecteurs e4, . .., e, el 


Ham —zx]0 pour n— 00. 


3. L'espace C° [a, b] des fonctions réelles continues sur [a, bl], 
muni du produit scalaire 


(f, &) (6) 


Î 
LR a 3 © 
ph 
ame 
Ch 
sr” 
2 
P, 
en 
se” 
Qu 
+ 
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est aussi un espace euclidien. Parmi les différentes bases orthogonales 
que l’on peut indiquer dans cet espace, la plus importante est four- 
nie par le système trigonométrique des fonctions 


(n—1, 2, ...). (7) 


4 t 
Hs COSN —— , 


2 


On vérifie aussitôt que ce système est orthogonal. 


Fig. 17 


Si l’on considère des fonctions continues sur un segment de lon- 
gueur 2x, par exemple, sur [—x, x], le système trigonométrique 
correspondant est formé par les fonctions 


_ cos nt, sin At (n—=1, 2, ...). 

Le système (7) est complet. En effet, d’après le théorème de 
Weierstrass, toute fonction œ, continue sur le segment [a, b] et 
prenant en a et b la même valeur, peut être considérée comme la 
limite d’une suite uniformément convergente de polynômes trigono- 
métriques, c.-à-d. de combinaisons linéaires des éléments du sys- 
tème (7). Une telle suite est à plus forte raison convergente en norme 
vers @ dans l’espace C? [a, b]. Si f est une fonction arbitraire 
de C? [a, b], elle peut être considérée comme la limite (selon la nor- 


me de l’espace C? [a, b]) d’une suite de fonctions ,, dont chacune 
coïncide avec f sur le segment | a, b — r) est linéaire sur | b 7 , 0 


et prend au point b la même valeur qu'au point a (fig. 17). Par con- 


séquent, tout élément de C? [a, b] peut être approché avec la pré- 
cision voulue (pour la métrique de cet espace) par une combinaison 
linéaire des éléments du système (7), d’où la complétude de ce der- 
nier. 

3. Existence de bases orthogonales, orthogonalisation. Dans toute 
la suite de ce paragraphe nous nous bornerons aux espaces euclidiens 
séparables (c.-à-d. contenant un ensemble partout dense et dénom- 
brable). Chacun des espaces cités au numéro précédent est séparable 
(démontrer !). On peut construire un exemple d'espace euclidien non 
séparable de la manière suivante. Considérons sur la droite numéri- 
que toutes les fonctions x telles que pour chacune d'elles l’ensemble 
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des points #4, é», . . ., où elle n’est pas nulle, est au plus dénombrable 
et la somme >» x° (t), étendue à tous ces points, est finie. Définissons 
dans cet espace les opérations d’addition et de multiplication par un 
nombre comme l'addition et la multiplication habituelles des fonc- 
tions et le produit scalaire par la formule 


(x, y) = 2x (6) y (), 


où la somme s'étend à tous les points £ tels que x (6) y (t) 0. La 
démonstration du fait que dans cet espace il n’existe aucun sous-en- 
semble partout dense et dénombrable est laissée au lecteur. Notons 
que cet espace est complet. 

Ainsi, soit À un espace euclidien séparable. Montrons que dans 
un tel espace tout système orthogonal est au plus dénombrable. 

En effet, sans restreindre la généralité, on peut supposer que le 
système en question {p,} est non seulement orthogonal, mais même 


orthonormé (sinon, on le remplacerait par le système Ya . Alors 


I Pa Il 
Pa — ps 1] = V2 pour à  B. 


Considérons l’ensemble des boules B C2 5) . Ces boules sont dis- 


jointes. Si l’ensemble dénombrable {#,} est partout dense dans À, 
chacune de ces boules renferme au moins un élément de {#ÿ,}. Par 
conséquent, l’ensemble de ces boules (et donc, l’ensemble des élé- 
ments ®.) est au plus dénombrable. 

Dans chacun des espaces euclidiens, considérés à titre d'exemple 
dans le numéro précédent, nous avons indiqué une base orthogonale, 
Démontrons maintenant le théorème général suivant, analogue au 
théorème d'existence d’une base othogonale dans un espace eucli- 
dien à r dimensions. 


Théorème 1 (de l’orthogonalisation). Soit 


fa fo .. fn .. (8) 


un système linéairement indépendant d'éléments d'un espace euclidien 
R. Alors dans R il existe un système d'éléments 
Pis Par + es ns + - + (9) 


satisfaisant aux conditions suivantes : 
1) Le système (9) est orthonormé : 
2) chaque élément ®, est une combinaison linéaire des éléments 


fi Î2 . În : 
Pn = Anifi +... annfne 


OÙ Ann Æ Ù; 
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3) chaque élément f, peut être mis sous la forme 


În = OniP1 + .. +Ünn@n 
avec bon 7 0. 
Chaque élément du système (9) est défini par les conditions 1)-3) 
de façon unique au facteur +1 près. 


Démonstration. On cherche l'élément œ, sous la forme 
Pi = Gif ; 


le coefficient a, est déterminé ici par la condition 


(Pis Pi) = di (far fa) = 1 


qui donne 
1 + 1 


Ba VOL 


Il est clair que , est défini ainsi de façon unique (au signe près). 
Supposons qu'on ait déjà construit les éléments œ} (k  n) véri- 
fiant les conditions 1)-3). Alors f, peut être mis sous la forme 


În = Dn1@1 + ... —+ Da, n1Pn-1 + hns 


di1 — 


(ns Qu)=0 pour k<n. 


En effet, les coefficients correspondants b,, (et donc, l'élément , 
aussi) sont déterminés de façon unique par les condilions 


(An; Pr) — (fn — On1P1 — … — Dh, n-1Pn-1» x) = 
— (fn; Pa) — One (xs x) = (0. 


Il est évident que (k,, k,) 0 (la supposition que (k,, h,) = 0 
serait en contradiction avec l'hypothèse que le système (8) est li- 
néairement indépendant). Posons 

LUS 
Vs 


D'après la construction inductive ci-dessus, il est clair que À,, 
et donc o, aussi, est une combinaison linéaire de f;, . . ., fn, C.-à-d. 
N { 
Pn = Anif1 + .. + Annfn: ou ann = 7 À 0 
De plus, 
(Pa; Pn) — {, (Pr; x) = (Æ Le n) 
et 


În = braPi + … + banPn (ban —= V' (a: Rn) Æ 0), 


c.-à-d. ®, vérifie les conditions du théorème. 
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Le passage du système (8) au système (9) vérifiant les conditions 
1)-3) s'appelle procédé d’orthogonalisation. 

Il est clair que les sous-espaces engendrés par les systèmes (8) et 
(9) coïncident. Par conséquent, ces systèmes sont ou tous les deux 
complets, ou tous les deux non complets. 

Corollaire. Dans tout espace euclidien séparable R il existe 
une base orthonormée. 

En effel, soil 4, Yo, - . ., Wn, . . . un ensemble dénombrable. 
partout dense dans À. Choisissons dans cet ensemble un système 
complet d'éléments linéairement indépendants {f,}. Pour cela il 
suffit d’exclure de la suile {b,} tout élément 1, qui peut être repré- 
senté par une combinaison linéaire de WŸ; avec i < k. En appii- 
quant au système complet d'éléments linéairement indépendants 
ainsi obtenu le procédé d’orthogonalisation, nous obtiendrons bien 
une base orthonormée. 


Exercices. 1. Donner un exemple d'espace euclidien (non séparable) 
ne possédant aucune base orthogonale. Démontrer que dans tout espace euclidier 
complet (non nécessairement séparable) il existe une base orthonormée. 

2. Démontrer que dans un espace euclidien complet (non nécessairement 
séparable) toute suite d’ensembles non vides emboîtés, dont chacun est convexe, 
fermé et borné, a une intersection non vide (cf. exercices pages 64 et 136). 


4. Inégalité de Bessel. Systèmes orthogonaux fermés. En choisis- 
sant dans l’espace euclidien à n dimensions R” une base orthonormée 


Ej, 69, +. +, En On peut écrire Lout vecteur x € R” sous la forme 
ni 
L € > Ch£k) (10) 
k=1 
où 
Ch — (x, ex). (11) 


Proposons-nous de généraliser la décomposition (10) au cas d’un 
espace euclidien de dimension infinie. Soit 


Das Pas + +) Pns + (12) 
un système orthonormé de l’espace euclidien À et soit f un élément 
arbitraire de À. Faisons correspondre à l'élément jÿ € À la suite des 
nombres 

Ch — (f, Px); k — 1, 2, .) (13) 


que nous appellerons coordonnées ou coefficients de Fourier de l’élé- 
ment f par rapport au système {4}, ainsi que la série (formelle pour 
le moment) 


2 CROR (14) 


que nous appellerons série de Fourier de l'élément f par rapport au 
système {; }. 
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Une question naturelle se pose : la série (14) est-elle convergente, 
c.-à-d. la suite des sommes partielles de cette série converge-t-elle 
(au sens de la métrique de l’espace À) vers une limite, et si elle est 
convergente, alors sa somme coïncide-t-elle avec l’élément initial f? 

Pour répondre à ces questions considérons préalablement le 


problème suivant: pour nr donné choisir les coefficients 

an (ë — 1,2, ..., n) de façon que la distance entre f et la somme 
n 

Sn = 2 Pr (15) 


soit minimale. Calculons cette distance. Comme le système (12) est 


orthonormé, on a 
n 


I f—Sn I? = (f— 2 ŒnPrs f— > ap) — 
R=1 kR=1 
= (f, f)—2 (f, 2 Be (OZ AUTE 2 œipi) — 


—||{|P —2 > aa, À oi =| fl 2 + 2 (or — cr)? 


Il est clair que cette expression atteint sa valeur minimale dans le 
cas où son dernier terme est nul, c.-à-d. pour 


Xp —= CR (k —= À, 2, ...) n). (16) 


Dans ce casson a 
MS = FIP— 2 cà, (17) 


Nous avons montré que, pour r donné, parmi toutes les sommes 
(15) celle qui s’écarte le moins de f est la somme partielle de ia 
série de Fourier de l’élément f. Ce résultat peut être expliqué géo- 
métriquement de la manière suivante. L'élément 


n 
f— 2 arps 
h=1 
est orthogonal à toutes les combinaisons linéaires de la forme 
n 
> BaPa 
k=1 
c.-à-d. il est orthogonal au sous-espace engendré par les éléments 
.; On Si et seulement si la condition (16) est remplie 


Pis Po, 
(vérifier !). Ainsi donc, le résultat obtenu est une généralisation du 
théorème bien connu en géométrie élémentaire disant que la 
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perpendiculaire abaissée d’un point donné sur une droite ou sur un 
plan est plus courte que toute oblique menée du même point. 
Comme on a toujours || f — S, |? > 0, de l'égalité (17) il suit que 


È cù || IP. 


Ici n est arbitraire et le second membre ne dépend pas de n; par 


O0 
Lé Le Lg a 
conséquent, la série ÿ cx est convergente et on a 


à cd <||f IP. (18) 
R=1 


Cette inégalité s'appelle inégalité de Bessel. Elle signifie géométri- 
quement que la somme des carrés des projections du vecteur f sur 
des directions deux à deux orthogonales est inférieure ou égale au 
carré de la longueur de ce vecteur f. 

Introduisons la notion importante suivante. 

Définition 1. Le système orthonormé (12) est dit fermé, 
si pour tout f € R on a l'égalité suivante 


2 c —||fll, (19) 
k=1 


appelée relation de Parseval. 
De l'identité (17) il résulte que le système (12) est fermé si et 
seulement si pour tout f € R la suite des sommes partielles de la 


série de Fourier > EnPn converge vers f. 


La notion de : Système orthonormé fermé est étroitement liée à 
la notion de système complet, introduite plus haut. 


Théorème 2. Dans un espace euclidien séparable R tout 
système orthornormé complet est fermé et réciproquement. 


Démonstration. Soit {,} un système orthonormé fer- 
mé; alors, quel que soit l’élément f € R, la suite des sommes par- 
tielles de sa série de Fourier converge vers /. Cela signifie que l’en- 
semble des combinaisons linéaires des éléments du système {,} 
est partout dense dans À, c.-à-d. que le système {p,} est complet. 
Réciproquement, si le système {oh} est complet, tout élément ÿ € À 
peut être approché avec n'importe quelle précision par une combinai- 
son linéaire 


n 
» CPR 
k=1 


10—0167 
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des éléments du système {p,}; la somme partielle 


n 


2 CxPx 


de la série de Fourier de jf fournit une approximation non moins 
exacte. Par conséquent, la série 


O0 


2: CROR 


converge vers /, de sorte que la relation de Parseval est vraie. 

Au numéro précédent nous avons démontré que dans un espace 
euclidien séparable il existe des systèmes orthonormés complets. 
Etant donné que pour les systèmes orthonormés la notion de fer- 
meture et celle de complétude coïncident, l’existence de systèmes 
orthogonaux fermés dans À ne nécessite pas une nouvelle démons- 
tration et les exemples de systèmes orthonormés complets, consi- 
dérés au numéro précédent, servent en même temps d’exemples de 
systèmes fermés. 

Jusqu'ici nous supposions toujours que tous les systèmes ortho- 
gonaux considérés étaient normés. Pourtant les notions de coeffi- 
cients de Fourier, de série de Fourier, etc. peuvent être formulées 
aussi pour des systèmes orthogonaux arbitraires. Soit {p,} un systè- 
me orthogonal arbitraire. À partir de ce système on peut construire 


un système orthonormé formé par les éléments w, = Pour 
n 
tout fERona 
4 
Cn = (}; Pa) = 7 Pn) 

et 

> CnŸn = > a On = > Ann; 

Pa Il 

n=1 n=1 n = 

où 
Cn (f, Pn) 
an = 2 — . 2 
7 I Pr Il Il Pn 12 ( 0) 


Les coefficients a, définis par la formule (20) s'appellent coefficients 
de Fourier de l'élément f par rapport au système orthogonal (non 
normé) {Ah}. En remplaçant dans l'inégalité (18) les coefficients c, 
par leurs valeurs c, = a, ||[®, || tirées de l'égalité (20), on obtient la 
relation 


2 en lF a <I IF (21) 
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qui représente l'inégalité de Bessel pour un système orthogonal 
arbitraire. 

5. Espaces euclidiens complets. Théorème de Riesz-Fischer. A par- 
tir du n° 3 nous n'avons considéré que des espaces euclidiens sépara- 
bles ; dès maintenant nous allons supposer, en outre, que tous les 
espaces considérés sont complets. 

Ainsi, soient À un espace euclidien séparable et complet et. 
{®,} un système orthonormé quelconque (non nécessairement com- 
plet) dans À. De l'inégalité de Bessel il résulte que pour que les 
nombres Ci, Co, + + ;. Cns - - . Servent de coefficients de Fourier pour 
un élément fER, il faut que la série 


soit convergente. Il se trouve que dans le cas d’un espace complet. 
celte condition est non seulement nécessaire, mais aussi suffisante. 
Plus précisément, on a le théorème suivant. 


Théorème3 (de Riesz-Fischer). Soit {p,} un 
système orthonormé quelconque dans un espace euclidien complet R 
el soient 


C1» Co; . 3 Cn: ee. + :e 


des nombres, tels que la série 


> cÀ (22) 
k=1 
soit convergente. Alors il existe un élément f € R tel que 
Ch = (f, Px) 
et 
D c =(f, f}=|/flP. 
k=1 
Démonstration. Posons 
ñn 
fn = D Chr. 
kR=1 
Alors 
n+p 
fnrp — fn |? = | Cn+1n41 + +. + CnrpPn+p | — , 2 Ch - 
=n 


La série (22) étant convergente, on en déduit, compte tenu de la 
complétude de À, que la suite {f,} converge vers un élément f € RÀ. 


10* 
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D'autre part, on a 
GP qi) = ns Pi) + ( — fn, pi): (23) 


ue premier terme de la somme figurant au second membre de cette 
égalité est égal à c; pour nr >i, tandis que son deuxième terme 
tend vers zéro quand n —+ oo, car 


TC — fn Ph LU — fllelpill. 


Le premier membre de l’égalité (23) ne dépend pas de n; donc, 
en passant à la limite pour ñ — oo dans cette égalité, on obtient 


(f, Pi) = Cie 
Comme, d’après la définition de f, 


[| f — f1ll— 0 quand nr —+ oo, 


on a 
D ch —(f, f). 
k—1 
En effet, 
(f— D cap, f— D capx)=(f, f)— D: c —+ 0 
k=1 kR=1 k=1 


quand n —> oo. 
Le théorème est démontré. 
Démontrons enfin le théorème utile suivant. 


Théorème 4. Pour qu'un système orthonormé {p,} d'éléments 
d'un espace euclidien séparable et complet R soit complet, il faut et 
il suffit que dans R il n'existe aucun élément non nul, orthogonal 
à tous les éléments du système {, }. 


Démonstration. Supposons que le système {p,} soit 
complet et, donc, fermé. Si f est orthogonal à tous les éléments du 
système {p,}, alors tous ses coefficients de Fourier sont nuls. Dans 
ce cas la relation de Parseval donne 


O0 


(, P= > c =0, 


R=—1 


d'où f = (0. 
Réciproquement, supposons que le système {p,} ne soit pas 
complet. Alors dans R il existe un élément g 0 tel que 


(g, > 2 ch (où cx=(g, px)). 
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D'après le théorème de Riesz-Fischer il existe un élément f € À 
tel que 


Gp=c et (f, D= TS 
k=1 


L'élément f — g est orthogonal à tous les p;. L’inégalité 


R=1 


implique que f/ — g 0. 
Le théorème est démontré. 


Exercices. 1. Soit H un espace euclidien complet (non nécessaire- 
ment séparable); alors dans Æ il existe un système orthonormé complet {, } 
(cf. exercice 1, page 143). Démontrer que pour tout vecteur f € H on a les 
décompositions 


[=D Pa) Pas II2= D, Pa)? 
(6 2 œ 


où chacune des sommes figurant aux seconds membres contient un nombre fini 
ou dénombrable de termes non nuls. 

2. Un système de vecteurs {p,} d’un espace euclidien R est dit total, si 
dans À il n'existe pas de vecteurs non nuls orthogonaux à tous les @,. Le théo- 
rème 4 montre que dans un espace euclidien complet la totalité d'un système 
de vecteurs est équivalente à sa complétude. Montrer que dans un espace non 
complet il peut y avoir des systèmes totaux non complets. 


6. Espace de Hilbert. Théorème de l’isomorphisme. Continuons 
l'étude des espaces euclidiens complets. Comme plus haut, nous 
nous inléresserons aux espaces de dimension infinie et non à ceux 
de dimension finie dont une étude exhaustive est donnée dans les 
cours d’algèbre linéaire. Comme auparavant, nous supposerons 
habituellement que chacun des espaces considérés contient un ensem- 
ble partout dense et dénombrable. Introduisons la définition suivante 

Définition 2. Un espace euclidien complet de dimension 
infinie s'appelle espace de Hilbert À). 

Autrement dit, on appelle espace de Hiblert un ensemble # 
d'éléments f, g, ... de nature arbitraire vérifiant les conditions 
(axiomes) suivantes 

I. À est un espace euclidien (c.-à-d. un espace vectoriel muni de 
produit scalaire). 

IT. L'espace H estcomplet au sens de la métrique p (f, g) = 
= [f— gi: 

III. L'espace Æ est de dimension infinie, c.-à-d. 
pour tout rz dans À ou peut trouver n éléments linéairement indé- 
pendants. 


1) En l'honneur du célèbre mathématicien allemand D. Hilbert (1862- 
1943) qui a introduit cette notion. 
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Le plus souvent on considère des espaces de Hilbert séparables, 
c.-à-d. des espaces vérifiant encore un axiome. 

IV. H est séparable, c.-à-.d. dans H il existe un ensemble 
partout dense et dénombrable. 

Comme exemple d'espace de Hilbert séparable on peut considé- 
rer l’espace L:. 

Par la suite nous nous bornerons aux espaces de Hilbert sépa- 
rables. 

Rappelons que deux espaces euclidiens À et À * sont dits iso- 
morphes, s’il est possible d'établir une correspondance biunivoque 
entre leurs éléments, telle que si 


ZT—x*, 
y<—y* 
(x yER;x*,y* E R®), 
on a 
Z+y— ai + y*, 
AX <> ax* 
et 


(x, y) + (x*, y*). 


Autrement dit, l’isomorphisme des espaces euclidiens est une 
correspondance biunivoque conservant aussi bien les opérations 
linéaires définies dans ces espaces que le produit scalaire. 

Comme on le sait, n'importe quels deux espaces euclidiens à 7 
dimensions sont isomorphes entre eux et, donc, chacun est isomor- 
phe à l’espace arithmétique R” (exemple 1, n° 2). Deux espaces eucli- 
diens de dimension infinie ne sont pas nécessairement isomorphes. 
Par exemple, les espaces Z, et C? [a, b] ne le sont pas. Cela résulte, 
par exemple, du fait que le premier est complet, tandis que le deuxiè- 
me ne l’est pas. 

Pourtant, on a le théorème suivant. 


Théorème 5. Tous les espaces de Hilbert séparables sont 
isomorphes entre eux. 


Démonstration. Montrons que tout espace de Hilbert 
H est isomorphe à l’espace /,. Par cela même l'affirmation du théo- 
rème sera démontrée. Choisissons dans À un système orthonormé com- 
plet arbitraire {œ,} et faisons correspondre à chaque élément 
f EH la suite c,, co, . . ., Cn, . . . de ses coefficients de Fourier 


O0 


par rapport à ce système. Puisque 2 Ch << oo, la suite (c4, Co, . . . 


«+ Cns « - -) est un élément de D. Réciproquement, d’après le 
théorème de Riesz-Fischer, pour tout élément (c4, C2, . . ., Cns + - .) 
de /, il existe un élément f € H ayant pour coefficients de Fourier les 
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nombres Ci, Co, + + ., Cns + « .« La Correspondance entre À et dl 
ainsi définie est biunivoque. D'autre part, si 
f <— (ci, Cgs + + +, Cno ...) 
et 
g + (di, de, CE dn, . .), 
on a 
f+ge (ci + di, Co + des : .., Cn + dns + - +) 
et 


af <> (ocy, ACa, + : ., Ans + + .), 


c.-à-d. à la somme de deux éléments correspond la somme des élé- 
ments correspondants et au produit d’un élément par un nombre 
correspond le produit de l’élément correspondant par le même 
nombre. Enfin, de la relation de Parseval il résulte que 


(f, £) — > Cndne (24) 


= 


En effet, 
ad / co L 
(f, f}= » ci, (£: g)= D dn 


et 


(+, 1+g)=(f, f)+2(, g)+(g 8) = 
_ 2! (cr L da) _ à, cn 2 2, ndn+ 2, de 


N—= 
d’où l'égalité (24). Ainsi donc, la correspondance que nous venons 
d'établir entre les éléments des espaces À et !, est bien un isomor- 
phisme. 

Le théorème établi ici montre qu'à un isomorphisme près, il 
existe un seul espace de Hilbert séparable (c.-à-d. le système 
d’axiomes I-IV est complet) et que l’espace /> peut être considéré 
comme une «réalisation en coordonnées» de cet espace, de même 
que l’espace arithmétique à nr dimensions, muni du produit scalaire 
rt 


> æiy:, est une réalisation en coordonnées de l’espace euclidien à 
=1 


= 
n dimensions, défini axiomatiquement. 

Une autre réalisation de l’espace de Hilbert est fournie par le 
complété de l’espace fonctionnel C? [a, b]. En effet, il est aisé de 
vérifier que le complété R* d’un espace euclidien quelconque R 
(au sens de la définition du complété d’un espace métrique, donnée 
au $ 3, chap. II) acquiert la structure d'espace vectoriel euclidien, 
si l’on prolonge par continuité à R* les opérations linéaires et la 
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multiplication scalaire définies dans À, c.-à-d. si l’on pose 


x+y=lim(rrtyn), ax=limar, 
n— 00 


n— 00 


et 
(x, y)—lim(xzn, Yn); 
ñn > 00 


OÙ Zn —> t Et Yn — Y, Xns Un E À. (L'existence de ces limites et leur 
indépendance du choix des suites {x,} et {y, }sont faciles à démon- 
trer.) Le complété de l’espace C? [a,b] est donc un espace euclidien 
complet ; il est évidemment de dimension infinie et séparable, donc 
un espace de Hilbert. Au chapitre VI nous reviendrons sur cette 
question et montrerons que les éléments qu’on doit adjoindre à 
C? [a, b] pour obtenir un espace complet peuvent être aussi considérés 
comme des fonctions, mais seulement comme des fonctions non 
continues (plus précisément, comme des fonctions à carré sommable 
au sens de Lebesgue). 

7. Sous-espaces, orthogonalité, somme directe. Conformément aux 
définitions générales du $ 3, on appelle variété linéaire dans un espace 
de Hilbert À un ensemble Z d'éléments de Æ tels que si f, g€L, 
on à af + Pg € L, quels que soient les nombres & et f. Une variété 
linéaire fermée s’appelle sous-espace. Considérons quelques 
exemples de sous-espaces d’un espace de Hilbert. 

1. Soit k un élément quelconque le A. L'ensemble de tous les 
éléments f € H orthogonaux à À forme un sous-espace de 7. 

2. Supposons À réalisé par /,, c.-à-d. ayant comme éléments 


les suites numériques (x, Zo, + +, Xn, . . .) telles que > Th << 00. 
À 


Les éléments soumis à la condition x, — x, forment un sous-espace 


de À. 
3. Supposons de nouveau A réalisé par l,. Les éléments x — 


— (ty, Lo, +. ., En, + + .) AVeC Æn — O0 pour n = 2, 4, 6, ... (el 
x, quelconque pour n — 1, 3, 5, ...) constituent un sous-espace 
de Æ 


Il est recommandé au lecteur de vérifier que tous les ensembles 
de vecteurs, indiqués dans les exemples 1-3, sont bien des sous-espaces. 

Tout sous-espace d’un ensemble de Hilbert représente soit un 
espace euclidien de dimension finie, soit même un espace de Hilbert. 
En effet, pour un tel espace les axiomes I-IIT sont évidents, l’axiome 
IV étant une conséquence du lemme suivant. 


Lemme. Tout sous-espace R' d'un espace métrique séparable Ki 
est lui-même séparable. 


Démonstration. Soit 


Es, Eo, +. Enr + - + 
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un ensemble dénombrable et partout dense dans À. Posons 
An — ini P(Ën, M). 
ner" 


Alors, quels que soient les entiers naturels n et m, il existe un point 
Mn, m € R” tel que 


{ 
P(Ën; Mn, m) < an +— . 
Soient € > 0 et Le; pour tout n € À” il existe n tel que 


P (En M LT 


et, par conséquent, 


P (Enr Mn, m) a+ <E+r= . 


Mais alors p (n, Nn.m) < &, C.-à-d. l’ensemble fini ou dénombrable 
{Mn.m} (%, m = 1, 2, ...) est partout dense dans RÀ. 

Les sous-espaces d’un espace de Hilbert jouissent de certaines 
propriétés spécifiques (qui n’ont pas lieu dans le cas des sous-espaces 
d’un espace normé arbitraire). Ces propriétés sont liées à la présence 
dans un espace de Hilbert du produit scalaire et de la notion d’ortho- 
gonalité, basée sur ce dernier. 

En appliquant le procédé d’orthogonalisation à une suite dénom- 
brable et partout dense d’éléments d’un sous-espace arbitraire d’un 
espace de Hilbert, on obtient le théorème suivant. 


Théorème G. Dans tout sous-espace M d’un espace de Hilbert 
H il existe un système orthonormé {p,} dont la fermeture linéaire 
coincide avec M. 


Soit M un sous-espace de l’espace de Hilbert Æ. Désignons par 
Mi=HOGM 


l’ensemble des éléments g € H orthogonaux à tous les éléments 
jf CM et démontrons que M1 est aussi un sous-espace de Æ. La 
linéarité de M1 est évidente, car de (g,, f) = (g:, f) = 0 il suit 
que (@yg4 + Gogo, f) — 0. Pour démontrer que ML est fermé con- 
sidérons une suite d'éléments g, € M1 convergeant vers g. Comme 
pour tout fE Mon a 


(8, j)= lim (8», j)=0, 


g est aussi un élément de M1. 

Le sous-espace MT est dit supplémentaire orthogonal du sous- 
espace M. 

Du théorème 6 on obtient facilement le théorème suivant. 
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Théorème 7. Si M est un sous-espace vectoriel (fermé!) de 
l'espace H, tout élément f € H peut être mis de façon unique sous la 
forme f—h+h avec h€EM et h° E M. 


Démonstration. Démontrons tout d’abord l’existence 
d’une telle décomposition. Pour cela, choisissons dans M un système 
orthonormé complet {p,} et posons 


h = 2: CnPn Cn = (}; Pn)- 
n= 


Puisque (d’après l'inégalité de Bessel) la série >, cè est convergente, 
n=1 
l'élément h existe et appartient à M. Posons 


h—=f—h. 
Il est évident que pour tous les nr on a 
(k', Pn) = 0 
et, comme tout élément & de M peut être mis sous la forme 


C— » AnQn) 
n=1 


on en déduit que 


O0 


(k”, = 2 An (h”, Pn) = 0, 


ce qui signifie que h° € M. 
Supposons maintenant que, outre la décomposition que l’on 
vient de construire f — À + h”, il existe une seconde décomposition 


f=h+th,, EM, heMr. 
Alors, pour tous les nr on a 


U7E Pn) — (f, Pn) — Cn) 
d'où 
h=h, h;=h". 


Le théorème 7 admet quelques corollaires utiles. 

Corollaire 1. Le supplémentaire orthogonal du supplémen- 
taire orthogonal d’un sous-espace vectoriel M de H coïncide avec M. 

Aïnsi, on peut parler des sous-espaces réciproquement supplé- 
mentaires de l’espace A. Si M et M1 sont deux sous-espaces réci- 
proquement supplémentaires de H et {w,}, {p1} sont deux systèmes 
orthogonaux complets (dans M et M respectivement), la réunion 
de {®.} et {p.} donne un système orthogonal complet dans l’espace 
H tout entier. On a donc le corollaire suivant. 
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Corollaire 2. Tout système orthonormé d'éléments de H peut 
être élargi de façon à obtenir un système complet dans H. 

Si le système {p,} est fini, le nombre de ses éléments est égal 
à la dimension du sous-espace M engendré par {p,} et à la codi- 
mension du sous-espace Mt. Aïnsi, on obtient encore un corollaire. 

Corollaire 3. Le supplémentaire orthogonal d'un sous-espace 
de dimension finie n est de codimension n, et réciproquement. 

Si tout vecteur f € H peut être mis sous la forme f = k + h 
avec hkE M et h" E ML (où M est le supplémentaire orthogonal 
de M), on dit que Æ est somme directe des sous-espaces orthogonaux 
M et M+ et on écrit 

H = MG Mt. 


Il est clair que la notion de somme directe peut être généralisée 
au cas d’un nombre fini quelconque et même d’une infinité dénom- 
brable de sous-espaces ; plus précisément, on dit que Æ est somme 
directe de ses sous-espaces M,, Mo, . .., M,, ... 


H=M MO... OM ®... 


1) les sous-espaces M; sont deux à deux orthogonaux, c.-à-d. 
tout vecteur de M; est orthogonal à tout vecteur de M, pour ik; 
2) tout élément f € H peut être mis sous la forme 


f=hi+h+...+hn +... hi EM 


et si les sous-espaces M, sont en nombre infini, la série D Il An |P 


si 


n 
est convergente. On vérifie facilement que si une telle décomposition 
de l’élément f existe, elle est unique et 


AP= ZIP: 


A côté de la somme directe de sous-espaces on peut parler de la 
somme directe d’un nombre fini ou d’une infinité dénombrable 
d'espaces de Hilbert. Plus précisément, si A, et FH, sont deux espaces 
de Hilbert, on définit leur somme directe H de la manière suivante : 
les éléments de l’espace Æ sont tous les couples (h;,, h>) tels que 
h, € H, et h2 € H), le produit scalaire de deux couples étant défini 
par la formule 


(Gas Re), (rs h2))= (us ho) + Ca, ho). 


Il est évident que l’espace Æ possède deux sous-espaces orthogonaux 
dont les éléments sont respectivement les couples de la forme (x, 0) 
et (0, 2); on peut identifier de façon naturelle le premier de ces 
sous-espaces à 7, et le second à A2. 

De manière analogue, on définit la somme directe d’un nombre 


fini arbitraire d'espaces de Hilbert. La somme H = > @ H, d’une 
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infinité dénombrable d'espaces H,, H:, ..., H,, ... est définie 
comme suit; les éléments de l’espace H sont toutes les suites de la 
forme 


h = (h;, ho, ..., h», ...)(h, € H,) 
telles que 
2111 An P < ce ; 
le produit scalaire (k, g) de deux éléments h, g € H est égal à 


2 (An, En)- 


8. Propriété caractéristique des espaces euclidiens. Examinons la 
question suivante. Soit À un espace normé. À quelles conditions 
supplémentaires doit satisfaire la norme définie sur À, pour que 
l’espace À soit euclidien, c.-à-d. pour que la norme sur À puisse 
être définie au moyen d’un produit scalaire? En d’autres termes, 
comment caractériser les espaces euclidiens parmi tous les espaces 
normés ? Une telle caractérisation est donnée par le théorème suivant. 


Théorème 8. Pour qu'un espace normé R soit euclidien, il 
faut et il suffit que, quels que soient les deux éléments f et g de R, on 
ail 

If + gs + UT — gl = 27 À + Hg 1. (25) 


Dans un espace euclidien cette égalité exprime une propriété 
bien connue du parallélogramme : la somme des carrés des diagonales 
du parallélogramme est égale à la somme des carrés de tous ses côtés. 
Sa vérification est immédiate : 


LÉ + g IP +7 — g IP = 
F+g f+g + — 8, f{ — £) = 
= 2(f, ÿ) +2 (8, 8) = 2 (If I + I g 


Ainsi, il est évident que la condition (25) est nécessaire. Démontrons 
qu'elle est suffisante. Posons 


É = (+1 210) (26) 


et montrons que si l’égalité (25) est vérifiée, la fonction (26) satisfait 
à tous les axiomes du produit scalaire. Etant donné que pour f = g 
on à 


G D= (2181 f—f1P) = [If IP, (27) 


c'est précisément le produit scalaire qui engendre la norme définie 
sur l’espace À. 
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Tout d’abord, d’après (26) il est immédiat que 
(f, 8) — (g, f), 
ce qui signifie que la propriété 1) du produit scalaire est vérifiée. 


D'autre part, en vertu de (27), la propriété 4) est aussi vérifiée. 
Pour établir la propriété 2) considérons la fonction de trois vecteurs 


€.-à-d. 
® (7, g, h) — 
Nf+g+hRË-f+g—-hk I — 
— HÉ+RÉ+NS-AI— 
— Hg+hË+Ug—Ah TI, (28) 
et montrons qu'elle est identiquement nulle. D’après (25) on a 
Nf+g+hkF=2If +RÈ +28 —-Nf+rk-8gl. 


En portant les expressions correspondantes dans (28), on obtient 


Ds h=-Nf+h-gF+N—-hk—- 81 + 
+Nf+AË—- TN —-R I — 
—Ug+kË+NIg—-2A I. (29) 


La demi-somme de (28) et (29) donne 
D(f, 8 k)=+(lleth+ffP+ eh —fle)— 
(en ef ea le RP. 


En vertu de (25), le premier terme est égal à 


Hg +R + 7 1, 
et le second à 
— Îg—hkÊ— NTI. 
Finalement, on a 
D (f, g, h) = 0. 


Démontrons, enfin, la propriété 3) qui exprime l’homogénéité 
du produit scalaire. Pour cela, fixons arbitrairement f et g et consi- 
dérons la fonction 


p (c) = (cf,g) — c (f,g). 


D'après (26) on a immédiatement 


p(O= (gl 11818) = 0 
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et æ(—1) — 0, puisque (—f, g) — — (f, g). C’est pourquoi pour 
tout entier n on a 
(nf, g) = (sgnnG +... +), 8) = 
= sgn n [(, 8) +... + (f, 8)l = 
= |[n|sgnn(f, g) =n(, 8) 
c.-à-d. (nr) = 0. Pour p, q entiers et 9-0 on a 


EE) =n(n 9) -£a(4r à 4 0 


c.-à-d. @ (c) — 0 pour tout c rationnel ; la fonction œ@ étant continue, 
on en déduit que 

o (c) = 0. 
Nous avons donc montré que la fonction (f, g) jouit de toutes les 
propriétés du produit scalaire. 


+ Lé « e LU n 
Exemples. 1. Considérons l’espace à nr dimensions R, dont 
la norme est définie par la formule 


FAO 


Pour p > 1 tous les axiomes de la norme sont vérifiés, pourtant R; 
est un espace euclidien seulement pour p = 2. En effet, considérons 


dans R; deux vecteurs : 
Î = (1, 1, 0, 3 + + 0), 
£& — (1, —1, 0, 0, ._ 0) ; 


f+g=—= (2, 0, 0,..., 0), 
f — g = (0, 2, 0, ..., O), 


1 
fl=lehe=2, Nf+elb=lf-21b=2, 
de sorte que pour p £ 2 l'identité du parallélogramme (25) n’est 
pas vérifiée. 
2. Considérons l’espace des fonctions continues sur le segment, 
| 0: 5 | . Posons 


On a 


d’où 


f () = cost, g(t) — sin £. 
Hfl=Hgi=1 


If+gll= max |cosésint| = V2, 
0O<i<x/2 


]f—gil= max |cosit—sint|—1. 
<t<7/2 


et 
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On voit donc que 
Nf+gF+f-glFÆ2S IP + eg 1. 


Par conséquent, il est impossible de définir la norme de l’espace 
C | 0, 7 | à l’aide d’un produit scalaire. Il est aisé de voir que l’espace 


des fonctions continues C [a, b] n’est pas un espace euclidien, quel 
que soit le segment [a, bl. 

9. Espaces euclidiens complexes. A côté des espaces euclidiens. 
réels on peut envisager des espaces euclidiens complexes (c.-à-d. 
des espaces vectoriels complexes munis de produit scalaire). Mais 
dans le cas d’un espace complexe les axiomes 1)-4) formulés au 
début de ce paragraphe ne peuvent pas être vérifiés tous à la fois. 
En effet, de 1) et 3) il résulte que 

(zx, Az) = M (x, à), 
d’où, pour À=i,on a 

(ix, ir) — — (x, x), 
ce qui veut dire que les carrés scalaires des vecteurs x et ix ne peuvent 
pas être tous les deux positifs. En d’autres termes, les axiomes 
1) et 3) sont incompatibles avec l’axiome 4). C’est pourquoi dans 
le cas d’un espace complexe les axiomes servant à définir le produit 
scalaire doivent être quelque peu modifiés. Nous définirons le 
produit scalaire dans un espace complexe comme une fonction 


numérique (à valeurs complexes) de deux vecteurs satisfaisant aux 
conditions suivantes : 


1) (x, y) — (y, x), 

2) (zx, y) = À (x, y), 

3) (ti + Les y) = (as, y) + (x, y), 

4) G&, 2) 20; (x, 2 0, si x 0. 
(Ainsi, nous avons modifié le premier axiome, en laissant inchangés 
les trois autres.) Des conditions 1) et 2) il suit que (x, Ày) = À (x, y). 
En effet, 

(x, Ay)= (y, x) = À (y, x) = À (x, y). 
Un exemple bien connu d’espace euclidien complexe à nr dimensions 
est fourni par l’espace C($ 1, exemple 2), dans lequel le produit 
scalaire de deux éléments 
ZT — (x, Los ee) Tn) et y — (y; Y2s +... Un) 


est défini par la formule 
ñn 


(x, y)= 2° avr. 
Rk=1 
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Comme on le sait, tout espace euclidien complexe de dimension n 
est isomorphe à cet espace. 

Comme exemples d'espaces euclidiens complexes de dimension 
infinie on peut considérer : 

1) l’espace complexe /, dont les éléments sont des suites de 
nombres complexes 


ZX = (ty, Lo, + +, Tn, + . .) 


vérifiant la condition 
[ee] 
2" | zx PF < 00 
N—= 


et le produit scalaire est défini par la formule 


CO 


(x, y) — » TnUn : 


2) l’espace C? [a, b] des fonctions à valeurs complexes, continues 
sur le segment [a, b] avec le produit scalaire 


b 


(A = \10806 4. 


a 


Dans un espace euclidien complexe la longueur (la norme) d'un 
vecteur est définie, comme dans le cas d’un espace réel, par la for- 
mule 


Ixl=V (x, 2). 
Généralement, dans un espace euclidien complexe on n'introduit 
1 Ù . T 
pas la notion d'angle de deux vecteurs (car l'expression GG , 


étant en général complexe, peut ne pas être le cosinus d’un angle 
réel) * tout de même, la notion d’orthogonalité est conservée : on dit 


que les éléments x et y sont orthogonaux, si (x, y) = 0. 

Si {p,} est un système orthogonal quelconque d'éléments d'un 
espace euclidien complexe À et f est un élément arbitraire de RÀ, 
comme dans le cas d’un espace euclidien réel, les nombres 


1 
An = To, jé U » Pn) 
s'appellent coefficients de Fourier et la série 


> Ann 
n 
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s'appelle série de Fourier de l'élément f par rapport au système 
orthogonal {p,}. On a l'inégalité de Bessel : 


Zn lan PE, D: 


En particulier, si le système {,} est orthonormé, les coefficients 
de Fourier pour un tel système sont définis par les formules 


Cn — (ÿ, Pn); 


et l'inégalité de Bessel prend la forme 
DenP<G, À. 


Un espace euclidien complexe complet et séparable de dimension 
infinie s'appelle espace de Hilbert complexe. Le théorème de l’isomor- 
phisme s'étend aux espaces de Hilbert complexes. 


Théorème 9. Tous les espaces de Hilbert complexes séparables 
sont isomorphes entre eux. 


La réalisation la plus simple d’un espace de Hilbert complexe 
est fournie par l’espace complexe /. Une autre réalisation, fonction- 
nelle, d’un tel espace sera donnée au chap. VI. 

On propose au lecteur de vérifier que tous les théorèmes démon- 
trés plus haut pour les espaces euclidiens, et en particulier pour 
les espaces de Hilbert réels sont vrais aussi pour les espaces complexes 
(avec des modifications insignifiantes tenant compte de la complexité 
du produit scalaire). 


$ ». Espaces vectoriels topologiques 


1. Définition et exemples. La donnée d’une norme n'est que 
l’une des méthodes possibles d'introduction d’une topologie dans 
un espace vectoriel. Le développement de certaines branches de 
l'analyse fonctionnelle, telles que la théorie des distri- 
butions (il en sera question au chapitre suivant), a montré 
que dans beaucoup de cas il est utile d'envisager des espaces vectoriels 
munis d’une topologie, définie non à l’aide d’une norme, mais d’une 
autre façon. 

Définition 1. On dit qu'un ensemble Æ est un espace 
vectoriel topologique, si 

I. E est un espace vectoriel (avec la multiplication de ses éléments 
par des nombres réels ou par des nombres complexes). 

II. £ est un espace topologique. 

III. Les opérations d’addition et de multiplication par un 
nombre dans £ sont continues par rapport à la topologie de Ë. 


11—0167 
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D'une manière plus détaillée, la dernière condition signifie 
ceci : 

1) Si zo = Zo + yo, pour chaque voisinage U du point z, on peut 
indiquer un voisinage V du point x, et un voisinage W du point yo 
tels que rt +yEU, Six EV et yEW;: 

2) Si &gto — ÿo pour tout voisinage U du point yo il existe un 
voisinage V du point x, et un réel e => 0 tels que ax € U dès que 
[a — apl<e et x E V. 

La liaison existant dans un espace vectoriel topologique entre 
les opérations algébriques et la topologie entraîne que la topologie 
sur un tel espace est parfaitement définie par la donnée de la famille 
des voisinages de zéro. En effet, soient x un point de l’espace vectoriel 
topologique Æ£ et U un voisinage de zéro dans Æ. Alors U + x, 
c.-à-d. le transformé de ce voisinage par une translation de vecteur x, 
est un voisinage de x; il est évident que tout voisinage d’un point 
quelconque x € E peut être obtenu de cette façon. 

De la continuité des opérations d’addition et de multiplication 
par un nombre dans un espace vectoriel topologique Æ£ on déduit 
immédiatement les propositions suivantes. 

4. Si U et V sont des ensembles ouverts dans E, alors l’ensemble 
UÙU + V (c.-à-d. l’ensemble de tous les éléments de la forme x + y, 
xzEU, yEV) est aussi ouvert. 

2. Si U est un ensemble ouvert, alors l’ensemble AU (c.-à-d. l’en- 
semble de tous les éléments de la forme Àx, x € U) est aussi ouvert, 
quel que soit À Æ 0. 

3. Si F est un ensemble fermé dans E, alors ÀF l’est aussi, quel 
que soit À. 

Exemples. 1. Parmi les exemples d'espaces vectoriels topo- 
logiques il faut citer tout d’abord les espaces normés. En effet, des 
propriétés de la norme il suit immédiatement que dans un espace 
normé l’addition des vecteurs et la multiplication d’un vecteur par 
un nombre sont des opérations continues par rapport à la topologie 
définie par la norme. 

2. Dans l’espace R”° des suites numériques arbitraires x — 


— (11, Lo, . . ., Xn, . . .) définissons un système fondamental de 
voisinages de zéro de la manière suivante. Chaque voisinage 
Ù (k1, . .., k,; €) est défini par les entiers k,, . . ., k, et le réel 


e > 0 et contient tous les x € R° tels que 


[ær, | <e, i=1,2,...,r 


On vérifie sans peine que la donnée de ce système de voisinages 
fait de R° un espace vectoriel topologique. (A côté de R° on peut 
considérer l’espace C” de toutes les suites de nombres com- 
plexes.) 
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3. Soit X La, b] l’espace des fonctions indéfiniment dérivables 1) 
sur le segment [a, b]. Définissons sur X La, b] une topologie à 
l’aide du système fondamental de voisinages de zéro suivant. Tout 
voisinage U,,, . appartenant à ce système est défini par Son numéro 
m et le réel & => 0 et renferme toutes les fonctions œ vérifiant les 
inégalités 

[ph (x)|<’e, k=0, 1, 2, ..., m, 


où p(® désigne la dérivée d'ordre 4 de la fonction . 

Le fait que dans un espace vectoriel topologique la topologie se 
trouve liée aux opérations linéaires soumet cette topologie à des 
conditions assez restrictives. Plus précisément, dans un espace vecto- 
riel topologique E tout point x et tout ensemble fermé qui ne le contient 
pas possèdent des voisinages disjoints. 

Pour la démonstration de cette proposition il suffit de considérer 
le point x — O0 et un ensemble fermé quelconque F ne contenant 
pas ce point. Posons U — EF. En vertu de la continuité de la 
soustraction dans Æ, il existe un voisinage de zéro W tel que: 
W— WU. En qualité de W on peut prendre l'intersection 
de deux voisinages de zéro W, et WA, tels quexzx — y EU, size W, 
et y € W;. Montrons que la fermeture du voisinage W est contenue 
dans U. Soit y EIWI]. Alors, tout voisinage du point y, y compris 
y + W, contient un point z2€ W. Par conséquent, il existe un 
point zEW tel que y+zEeW, don yEW—WaU, d'où 
l'affirmation annoncée. Les voisinages cherchés du point 0 et de 
l'ensemble F sont respectivement W et EXIWI. 

Un espace topologique est dit T',-espace, s’il satisfait au premier 
axiome de séparation T,, c.-à-d. si dans cet espace tout sous-ensemble 
comportant un seul point est fermé; il est évident qu’un espace 
vectoriel topologique est un T',;-espace si et seulement si l’intersection 
de tous les voisinages de zéro ne contient pas d'éléments non nuls. 
Les espaces topologiques satisfaisant aux axiomes de séparation 
T, et T,; ont été appelés au chap. IT espaces réguliers; d’après ce 
qu’on vient de démontrer dans l’alinéa précédent, fout espace vectoriel 
topologique du type T, est régulier. 

Dans les espaces normés un rôle important joue la notion d’en- 
semble borné. Bien que’ cette notion y soit introduite à l’aide de 
la norme, elle peut être formulée de façon naturelle pour des espaces 
vectoriels topologiques quelconques. 

Un ensemble M, contenu dans un espace vectoriel topologique £, 
est dit borné, si à tout voisinage de zéro U on peut associer un entier 
naturel n tel que AU = M pour tous les À qui vérifient la condition 
[AZ n. 


1) C.-à-d. admettant des dérivées de tout ordre. 
41* 
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Il est clair que dans le cas d’un espace normé cette notion d’en- 
semble borné coïncide avec celle d'ensemble borné en norme (c.-à-d. 
avec la possibilité de placer l’ensemble donné à l’intérieur d’une 
boule || x | < À). L'espace Æ est dit localement borné, s’il contient 
au moins un ensemble non vide ouvert et borné. Tout espace normé 
est localement borné. Un exemple d'espace non localement borné 


est donné par l’espace R°” de l’exemple 2 (démontrer !). 


Exercices. 1. Soit E un espace vectoriel topologique; démontrer les 
propositions suivantes: 

(a) un ensemble M E est borné si et seulement si pour toute suite 
{z,}c M et toute suite de nombres positifs {e, } convergeant vers zéro, la suite 
{Eh2n} converge vers zéro; 

(b) si {,}h 1€ E et x, —+ x, alors {x,} est un ensemble borné: 

(c) si l’espace E est localement borné, il satisfait au premier axiome de 
_dénombrabilité. 

Le premier axiome de dénombrabilité est-il satisfait dans l’espace R°? 

2. Nous dirons que dans n espace vectoriel topologique H un ensemble M 
est absorbé par le voisinage de zéro U, s’il existe un entier naturel n tel que nU = 
— M. Démontrer que dans tout espace localement borné il existe un système 
fondamental de voisinages de zéro s’absorbant mutuellement. Que peut-on 
prendre pour un tel système dans un espace normé? 

2. Convexité locale. Les propriétés dont jouissent les espaces 
vectoriels topologiques arbitraires peuvent être très différentes des 
propriétés habituelles des espaces euclidiens ou normés. Une classe 
importante d'espaces, plus généraux que les espaces normés, mais 
conservant beaucoup de propriétés de ces derniers, est formée par 
les espaces dits localement convexes. 

Définition 2. Un espace vectoriel topologique est dit 
localement convexe, si tout ensemble ouvert non vide de cet espace 
contient un sous-ensemble non vide ouvert et convexe. 

Notons que si l’espace £ est localement convexe, pour tout point 
z£Æ et tout voisinage ÜU de x il existe un voisinage convexe V 
de ce point, tel que x € V & U. En effet, il suffit d'établir la vérité 
de cette affirmation pour le point x — 0. Soit U un voisinage quel- 
conque de zéro. Alors il existe un voisinage V de zéro tel que 
V — V & U. Comme l’espace E est localement convexe, il existe 
un ensemble non vide ouvert et convexe V” € Y. Soit y € V”; alors 
.V' — y est un voisinage convexe de zéro, contenu dans U. 

Tout espace normé est localement convexe. En effet, dans un tel 
espace tout ensemble ouvert non vide contient une boule. Ainsi, 
tout espace normé est localement borné et localement convexe. On peut 
démontrer qu'au fond les espaces normés sont les seuls à posséder 
ces deux propriétés à la fois. Plus précisément, convenons de dire 
qu'un espace vectoriel topologique Æ est normable, si la topologie 
donnée dans £ peut être définie à l’aide d’une norme. Alors on a le 
théorème suivant : éout espace vectoriel topologique séparé, localement 


< 


convexe et localement borné, est normable. 
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Exercices. 1. Démontrer que dans un espace vectoriel topologique 
un ensemble ouvert U est convexe si et seulement si U + U = 2U. 

2. Soit Æ un espace vectoriel; un ensemble U € E est dit symétrique, si 
x € U implique —zx € U. Soit 8 la famille des sous-ensembles symétriques et 
convexes de l’espace Æ dont chacun coïncide avec son noyau (cf. $ 2). Etablir la 
vérité des propositions suivantes. 

(a) La famille 8 représente le système fondamental de voisinages de zéro 
pour une topologie séparée et localement convexe de l’espace E (nous dirons que 
cette topologie est nucléaire convete). 

(b) La topologie nucléaire convexe est la plus forte parmi les topologies 
localement convexes, par rapport auxquelles les opérations linéaires définies 


dans £ sont continues. 
(c) Toute fonctionnelle linéaire sur £ est continue par rapport à la topologie 


nucléaire convexe. 


3. Espaces dénombrablement normés. Une classe d'espaces vecto- 
riels topologiques, importante pour l’analyse, est constituée par les 
espaces dits dénombrablement normés. Pour formuler la définition 
correspondante nous aurons besoin d’une notion auxiliaire. 

Soient || - |, et || : ||} deux normes sur un espace vectoriel Æ. 
On dit qu'elles sont concordantes, si toute suite {x,} de Æ, qui est 
une suite de Cauchy pour chacune de ces normes et converge vers 
une limite x € E par rapport à l’une d'elles, converge vers la même 
limite x par rapport à l’autre. 


On dit que la norme ||-|l, est non moins faible que la norme ||-|L, s’il existe 
une constante c = 0 telle que {zh > c [|zil pour tous les ze E. 

Si la première norme est non moins faible que la seconde et la seconde est 
non moins faible que la première, on dit que ces deux normes sont équivalentes. 
Deux normes sont dites comparables, si l’une d'elles est non moins faible que 

autre. 


Définition 3 On appelle espace dénombrablement normé 
un espace vectoriel £ muni d’une famille dénombrable de normes 
| - [L deux à deux concordantes. Tout espace dénombrablement 
normé devient vectoriel topologique, si l’on prend pour système 
fondamental de voisinages de zéro la famille d’ensembles U,,, 
dont chacun est défini par son numéro r et le réel positif & et contient 
tous les éléments x € E vérifiant les conditions 


x he, -.., [rl <e. 


Nous proposons au lecteur de vérifier qu’un tel sytème de voisi- 
nages de zéro définit bien sur Æ une topologie, par rapport à laquelle 
les opérations linéaires définies dans Æ sont continues. 

Notons que tout espace dénombrablement normé satisfait au 
premier axiome de dénombrabilité, car le système de voisinages 
de zéro U,,, peut être remplacé (sans changer la topologie) par un 
sous-système dénombrable tel que € ne prend que les valeurs 1, 
4 1 { 
9 3 ? . n 
blement normé peut être définie au moyen d’une métrique, par 


, . . . De plus, la topologie sur un espace dénombra- 
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exemple 


… _n Î T— y |\n 
p (x; y)= > 2 Te —vÎn x, yCE. (1) 
n=1 
On propose au lecteur de vérifier que la fonction p (x, y) vérifie 
tous les axiomes de la distance, qu'elle est invariante par rapport 
aux translations (c.-à-d. p (x + z, y + z) = p (x, y}, x, y, 2 € Ejet 
que la topologie qu’elle engendre coïncide avec la topologie initiale. 
Ainsi, nous pouvons parler de la complétude d’un espace dénombra- 
blement normé, en sous-entendant par là la complétude relativement 
à la métrique introduite ci-dessus. Notons encore qu’une suite 
donnée {r,} est une suite de Cauchy pour la métrique (1) si et seule- 
ment si elle est une suite de Cauchy pour chacune des normes || + |, 
et qu’elle converge (pour cette métrique) vers un élément x € E 
si et seulement si elle converge vers cet élément x selon chacune des 
normes || - |}. Autrement dit, la complétude d’un espace dénombra- 
blement normé signifie que dans un tel espace toute suite de Cauchy 
pour chacune des normes || - |}, est nécessairement convergente. 
Exemples. 1. Un exemple important d'espace dénombrable- 
ment normé est fourni par l’espace À [a, b] des fonctions indéfini- 
ment dérivables sur un segment (cf. exemple 3, n° 1), si la norme 
Il + [ln Sur cet espace est définie par la formule 


— SU (R) 
[fl Sup, 11% 1: 


O<hk<m 


Il est évident que toutes ces normes sont concordantes entre elles 
et qu’elles définissent sur Æ la, b] justement la topologie introduite 
plus haut. 

2. Soit S l’espace des fonctions indéfiniment dérivables sur la 
droite numérique qui tendent, à l'infini, vers zéro avec toutes leurs 
dérivées plus rapidement que Cr à n'importe quelle puissance (c.-à-d. 
qui vérifient la condition: LCL (£) — 0 pour | é | — «, quels que 
soient k et gfixés). Définissons sur cet espace une famille dénombrable 
de normes, en posant 


lfllm— sup JéKD(G)|, m—=0, 1, 2, 
R, q<m 
— 00 <<< 00 


On vérifie sans peine que ces normes sont concordanties entre elles. 
Donc, $ est bien un espace dénombrablement normé. 

3. Un cas particulier important des espaces dénombrablement 
normés est constitué par les espaces dits dénombrablement hilbertiens. 
Soit À un espace vectoriel muni d’une famille dénombrable de pro- 


duits scalaires (p, d), tels que les normes ||[® |} — /(p, œh\ cor- 
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respondant à ces produits scalaires soient concordantes entre elles. 
Un tel espace, s’il est complet, s'appelle espace dénombrablement 
hilbertien. 

4. Un exemple concret d'espace dénombrablement hilbertien 
est donné par l’espace suivant. Soit ® l’ensemble de toutes les 
suites numériques {x,} telles que pour chaque entier 4 > 0 la série 


CO 


_ 
>», ni 
n—1 


est convergente. Définissons sur cet espace une famille dénombrable 


de normes, en posant 
O0 
= À n'Tn. 
n—=1 


Il est aisé de vérifier que ces normes sont concordantes entre elles 
et que l’espace D est complet au sens indiqué ci-dessus. IT est clair 
que chacune des normes ||-|; peut être donnée à l’aide du produit 
scalaire 


(x, ya) — 2: R"Tnÿn: 
n—= 


ce qui signifie que ® est un espace dénombrablement hilbertien. 
On l’appelle espace des suites rapidement décroissantes. 

Si Æ est un espace dénombrablement normé, on peut supposer 
que les normes ||-|}, dont il est muni satisfont à la condition 


x Île LT ÎL pour £ << [, (2) 


car dans le cas contraire on pourrait remplacer les normes {| x ||4 
par les normes 


Icik=sup{|zls [rie {|} 
qui définissent sur £ la même topologie que la famille de normes 
initiale. En complétant l’espace Æ selon chacune des normes ||-||, 


nous obtiendrons une famille d'espaces normés complets Æ,. Grâce 
à la relation (2) et à la concordance des normes, on a les inclusions 
naturelles 

E, DE; pour k# < L. 


Aïnsi, à tout espace dénombrablement normé on peut associer une 
suite décroissante d'espaces normés complets 


E,>E:>...2E;,—; n Er > E. 
k—1 


On peut démontrer que l’espace Æ est complet si et seulement si 


E =/fN\E£Æ% (démontrer!). Aïnsi, par exemple, l’espace X [a, b] 
1 
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des fonctions indéfiniment dérivables sur le segment [a, b] constitue 
l'intersection des espaces normés complets D” (n — 0, 1, 2, ...) 
où D" désigne l’espace des fonctions admettant des dérivées conti- 
nues jusqu’à l’ordre n inclusivement, sus lequel la norme est définie 
par la formule 


Lf1= sup 1° GO 
a<t<b 
O<R<n 


Dans les années trente, au moment où, grâce aux travaux de Banach, la 
théorie des espaces vectoriels normés était déjà construite, l'impression s’était 
faite que cette classe d'espaces était suffisamment vaste pour satisfaire tous les 
besoins concrets de l’analyse. Mais plus tard il est apparu qu'il n’en était pas 
ainsi. Il s’est avéré que dans beaucoup de questions on a affaire à des espaces, 
tels que l’espace des fonctions indéfiniment dérivables, l'espace R° de toutes 
les suites numériques, etc., dont la topologie naturelle ne peut pas être définie 
à l’aide d’une norme. Par conséquent, les espaces vectoriels topologiques non 
normés ne présentent rien d’« exotique » ou de « pathologique ». Bien au contrai- 
re, certains de ces espaces représentent des généralisations de l’espace euclidien 
de dimension finie, non moins naturelles et importantes que, par exemple, 
l'espace de Hilbert. 


CHAPITRE IV 


Fonctionnelles linéaires 
et opérateurs linéaires 


$ 1. Fonctionnelles linéaires continues 


1. Fonctionnelles linéaires continues sur un espace vectoriel 
topologique. Nous avons déjà considéré des fonctionnelles définies 
sur un espace vectoriel au $1, chap. IIT. Lorsqu'il s’agit des fonc- 
tionnelles sur un espace vectoriel topologique, ce sont les 
fonctionnelles continues qui présentent l'intérêt principal. 
Comme d'habitude, une fonctionnelle jf définie sur l’espace £ s’appelle 
continue, si pour tout e >> 0 et tout xo € E il existe un voisinage 
U de l'élément x, tel que 

| f (x) — f(xo) <e pour x EU. (1) 
Cette définition est valable, en particulier, pour les fonctionnelles 
linéaires. 

Si Æ£ est un espace vectoriel topologique de dimension 
finie, toute fonctionnelle linéaire sur Æ est automatiquement 
continue. Dans le cas général, la linéarité d’une fonctionnelle 
n'implique pas sa continuité. 

La proposition qui suit, bien que presque évidente, est impor- 
tante pour la suite. 

Si une fonctionnelle linéaire f est continue en un point x € E, elle 
est continue partout sur E. 

En effet, soit y un point quelconque de £ et soit & >> 0. Choisis- 
sons un voisinage U du point x de façon que la condition (1) soit 
remplie. Alors la translation de ce voisinage 


V=U+GY—2 


nous donnera le voisinage cherché du point y, car si z € V, on a 
z+x—y@U et, par conséquent, 


If —fWI=lfG-y+z —f(a)l<e. 


Donc, pour établir la continuité d’une fonctionnelle linéaire, 
il suffit de vérifier si elle est continue en un point au moins, par 
exemple, au point 0. 

Si l’espace ÆE satisfait au premier axiome de dénombrabilité, 
la continuité d’une fonctionnelle linéaire peut être exprimée en: 
termes de suites: une fonctionnelle f est dite continue au point. 
x CE, si x, — x implique f (x,) — f (x). La vérification du fait 
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que cette définition de la continuité est équivalente à la précédente 
{à condition que le premier axiome de dénombrabilité soil satisfail) 
est laissée au lecteur. 


Théorème 1. Pour qu'une fonctionnelle linéairef soit continue 
sur E, il faut et il suffit qu'il existe un voisinage de zéro dans E, sur 
lequel la fonctionnelle f soit bornée. 


Démonstration. Si la fonctionnelle f est continue au 
point O0, pour tout & >> Ô il existe un voisinage de zéro, sur lequel 


IfG@)I< e. 
Inversement, soit ÜU un voisinage de zéro tel que 


|fG&)|<C pour xEU 


. E » + 7 . z 
et soit e >> 0. Alors 7 U est précisément le voisinage de zéro, sur 


lequel | f (x) ! €. On en déduit que la fonctionnelle f est continue 
au point O et donc, partout. 


Exercice. Soit £ un espace vectoriel topologique; démontrer les 
propositions suivantes. 

(a) Une fonctionnelle linéaire f sur £ est continue si et seulement s'il existe 
un ensemble ouvert UC E et un nombre t tels que t & f (U), où f (U) désigne 
l’ensemble des valeurs de jf sur U. 

(b) Une fonctionnelle linéaire f sur Æ est continue si et seulement si son 
ensemble des zéros {x/f (x) — 0} est fermé dans E. 

(c) Si toute fonctionnelle linéaire sur Æ£ est continue, la topologie de E 
coïncide avec la topologie nucléaire convexe (cf. exercice 2, page 165). 

(d) Si l’espace E est de dimension infinie et normable, L existe une fonc- 
tionnelle linéaire non continue sur E (utiliser l’existence dans Æ d’une base de 
Hamel; cf. exercices, page 119). 

(e) Supposons que dans E il existe un système fondamental de voisinages de 
zéro dont la puissance est inférieure ou égale à la dimension algébrique de l’es- 
pace Æ (c.-à-d. à la puissance de la base de Hamel dans £E ; cf. exercices, 
page 119). Alors il existe une fonctionnelle linéaire non continue sur £. 

(f) Pour qu’une fonctionnelle linéaire f soit continue sur Æ, il faut et, si Æ 
satisfait au premier axiome de dénombrabilité, il suffit que cette fonctionnelle 
soit bornée sur tout ensemble borné. 


2. Fonctionnelles linéaires sur un espace normé. Supposons 
l’espace considéré Æ normé. D’après le théorème 1, toute fonction- 
nelle linéaire continue jf est bornée dans un voisinage de zéro. Mais 
dans un espace normé tout voisinage de zéro contient une boule; 
donc, f est bornée dans une boule. En vertu de la linéarité de la 
fonctionnelle f, cela équivaut à ce qu’elle soit bornée dans toute 
boule, en particulier, dans la boule unité || x [| 1. Réciproque- 
ment, si la fonctionnelle jf est bornée dans la boule unité, d’après 
le théorème 1 elle est continue (car l’intérieur de cette boule est 
un voisinage de zéro). 

Ainsi, une fonctionnelle linéaire est continue sur un espace normé 
si et seulement si les valeurs prises par cette fonctionnelle sur la boule 
unité forment un ensemble borné. 
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Soit f une fonctionnelle linéaire continue sur l’espace normé Æ. 
Le nombre 


Nfl= sup [f(x)l (2) 
x 11<1 


c'est-à-dire la borne supérieure de l’ensemble des valeurs de |f (x) | 
sur la boule unité de l’espace E, s'appelle norme de la fonctionnelle f. 
Notons que || f || jouit des propriétés presque évidentes suivantes : 


1) {F1 sup ©) ; 
x-0 I x |] 


ceci résulte immédiatement du fait que pour tout x Æ 0 on a 


LF(x)| T 
er Gé) 
2) Pour tout € E on a 
FACE IR IEAIE (3) 
En effet, si x = 0,l’élément TT 
selon la définition de la norme d’une fonctionnelle, on a 


FE <s 


d’où l’on obtient (3). Si x — 0, les deux membres de l'inégalité (3) 
s’annulent. 


appartient à la boule unité; donc, 


Exercice. Soit C > 0 un nombre vérifiant l'inégalité 
NF @I<CHzI (&) 


pour tout x. Démontrer que ||f [| = inf C, où la borne inférieure est étendue à tous 
les nombres C vérifiant l'inégalité (4). 


Considérons quelques exemples de fonctionnelles linéaires sur 
des espaces normés. 

1. Soit R” l’espace euclidien à nr dimensions et soit a un vecteur 
quelconque choisi dans cet espace. Le produit scalaire 


f (&) = (x, a), 


où x parcourt tout l’espace R”, est évidemment une fonctionnelle 
linéaire sur R7. En vertu de l'inégalité de Cauchy-Bouniakovsky, on a 


f@I= IG a) 1< za; (5) 


par conséquent, cette fonctionnelle est bornée, et donc continue, 
sur R”. De l'inégalité (5) on obtient 


| f(x) 
<a: 


472 FONCTIONNELLES ET OPÉRATEURS [Ch. IV 


Comme le second membre de cette inégalité ne dépend pas de x, on a 


sup MEL al. 


c'est-à-dire || f [| < || a ||. Maïs, en posant x — a, on obtient 


EL = fa 


[f(a)l=(a, a)=|Ilall, c.-à-d. 


Donc, 
If = at. 
2. L'intégrale 
b 
I (x)= | x (t) dé, 
a 
où x (é) est une fonction continue sur la, b], représente une fonction- 
nelle linéaire sur l’espace C La, bl. Cette fonctionnelle est bornée 
et sa norme est égale à b — a. En effet, 
b 
1 (a)1=|T 20 d[<max| 2 (1(@—a)=11 211 @— 0) 
a 
l'égalité ayant lieu pour x = const. 
3. Considérons un exemple plus général. Soit yo (é) une fonction 
continue sur [a, bl, arbitrairement choisie. Posons pour toute 
fonction x (&) EC [a, b] 


b 
F(x)= | x (#) vo (#) dt. 
C'est une fonctionnelle linéaire. Elle est bornée, car 


ra roubaleien five (6) 


a a 


Du fait qu’elle est linéaire et bornée on conclut qu’elle est continue. 
De l'inégalité (6) on obtient l'estimation de sa norme: 


b 
NF À 1201 dr. 


(e) 


e Lé Li ° 


4. Considérons dans l’espace C [a, b] la fonctionnelle linéaire 


Oo (Z) = & (to), 
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déjà mentionnée au n° 5, $ 1, chap. III. Sa valeur en x (t) coïncide 
avec la valeur de la fonction x (t) au point donné to. Il est clair que 


ÉADRES IE! 


et pour x = const il y a égalité. On en déduit aussitôt que la norme 
de la fonctionnelle ô:, est égale à 1. 

9. Sur tout espace euclidien X on peut définir une fonctionnelle 
linéaire de la même façon que sur R”, en choisissant un élément 
fixe a € À et en posant pour tout x € À 


F (x) = (x, à). 
Comme dans le cas de l’espace R”, on vérifie facilement que 
TFN= Ia fl 


Dans ce qui suit nous ne considérerons que des fonctionelles 
linéaires continues; c’est pourquoi, par abus de langage, le mot 
« continu » sera omis. 

La notion de norme d’une fonctionnelle linéaire admet l’inter- 
prétation géométrique suivante. Nous avons vu (chap. III, $ 1) 
qu'à toute fonctionnelle linéaire on peut associer un hyperplan 
L défini par l'équation 


f (x) = 1. 


Cherchons la distance d de cet hyperplan au point 0. Par définition, 
d = inf [x ||. En vertu de l'estimation 


f(=1 
f@)1< FIX 


sur l'hyperplan f (x) — 1 on a ||x || >T et donc, d > TT 


part, selon la définition de la norme de f, à tout e& > 0 on peut 
associer un élément x, vérifiant la condition f (x,.) — 1 et tel que 


1> (If e)xe l; 


. D'autre 


par conséquent, 
. 1 
d= inf ||x ———. 
f@)=1 Iall< Il 1] —e 


Comme £e >> 0 est arbitrairement petit, on en déduit que 


ms 1 e 
_ Nil? 


donc, la norme d’une fonctionnelle linéaire f est l'inverse de la distance 
du point O à l'hyperplan f (x) = 1. 

3. Théorème de Hahn-Banach dans un espace normé. Au $ 2, 
chap. III, nous avons démontré le théorème général de Hahn-Banach 


d 
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qui affirme que toute fonctionnelle linéaire f,, définie sur un sous- 
espace ZL d’un espace vectoriel Æ et satisfaisant à la condition 


| fo &) 1 p (x) (7) 


(où p est une fonctionnelle convexe fixée sur Æ), peut être prolongée 
à l’espace Æ tout entier sans violer la condition (7). Pour le cas 
d’un espace normé ce théorème peut être énoncé de la manière sui- 
vante : 

Soient E un espace normé réel, L un sous-espace de E et fo une 
fonctionnelle linéaire bornée sur L. Cette fonctionnelle peut être pro- 
longée de façon à obtenir une fonctionnelle linéaire f sur l’espace E 
tout entier sans augmenter la norme, c'est-à-dire de façon que 


Il fo [lsur z — Il 7 [lsur E° 
En effet, soit 
Ï Jo [Îsur z — k. 


Il est clair que k|| x || est une fonctionnelle convexe. En prenant 
cette fonctionnelle pour p et en appliquant le théorème général 
de Hahn-Banach, on obtient le résultat voulu. 

Le théorème de Hahn-Banach sous cette forme admet l’inter- 
prétation géométrique suivante. L’équation 


fo (x) = 1 () 
définit dans le sous-espace Z un hyperplan situé à la distance [ 


de zéro. En prolongeant la fonctionnelle f, à l’espace Æ tout entier; 
sans augmenter sa norme, nous traçons par cet hyperplan « partiel » 
un hyperplan « plus grand » dans l’espace Æ tout entier, sans lui 
« permettre» de s'approcher de zéro. 

La version complexe du théorème de Hahn-Banach (théorème 4a, 
$ 2, chap. IIT) nous fournit l’analogue complexe du théorème précé- 
dent : 

Soit E un espace normé complexe et soit f, une fonctionnelle linéaire 
bornée, définie sur un sous-espace L € E Alors il existe une fonction- 
nelle linéaire bornée f, définie sur tout l’espace E et vérifiant les con- 
ditions 

Î (x) — Jo (x), zx CL, 
I { sur — I follsur Le 


Du théorème de Hahn-Banach pour un espace normé on déduit 


le résultat important qui suit. 
Corollaire. Soit E un espace normé. Quels que soient x;, 
x CE, x, = x, il existe une fonctionnelle linéaire continue f qui 


sépare ces points, c'est-à-dire telle que f (x1) = f (xo). 
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En effel, ceci équivaut à l’existence, pour tout x, 5 O0, d’une 
fonctionnelle f séparant x, de 0, c’est-à-dire telle que f (xo) 0. 
Pour construire une telle fonctionnelle, considérons d’abord les 
éléments de la forme Àx, et définissons sur le sous-espace formé 
par ces éléments une fonctionnelle f,, en posant f (Axo) — À ; ensuite, 
prolongeons cette fonctionnelle (en utilisant le théorème de Hahn- 
Banach) à l’espace Æ tout entier. En définitive, nous obtiendrons 
une fonctionnelle linéaire continue f vérifiant la condition f (xo) — 
= 1 LOC. 

4. Fonctionnelles linéaires sur un espace dénombrablement 
normé. Soit Æ un espace dénombrablement normé avec les normes 


Il-[x (& = 1, 2, ...); sans restreindre la généralité, on peut sup- 
poser (cf. page 167) que pour tout xE€ÆE on a 
cl Kris < Karl <<... (9) 


Soit / une fonctionnelle linéaire continue sur £ ; il existe alors dans Æ 
un voisinage de zéro U, dans lequel la fonctionnelle f est bornée. 
D'après la définition de la topologie sur un espace dénombrablement 
normé, il existe un entier naturel Æ et un réel & > 0, tels que la 
boule B,,, — {x:|| xflx << &} soit située entièrement dans U. Par 
conséquent, la fonctionnelle f est bornée dans cette boule et donc, 
bornée et continue par rapport à la norme {|:[|,, c’est-à-dire il existe 
une constante C telle que 


If I<CIzlh, zeE. 


D'autre part, il es évident que si une fonctionnelle linéaire est 
bornée par rapport à l’une des normes ||-|,, elle est alors continue 
sur £. Donc, si £? est l’ensemble de toutes les fonctionnelles linéaires 
sur Æ, continues par rapport à la norme ||-|,, et E* est l’ensemble 
de toutes les fonctionnelles linéaires continues sur Æ£, on a 


E*— Ù Ex. (10) 


De la condition (9) il résulte, en outre, que 
EFCEÉC...cEce... 


Si f est une fonctionnelle linéaire continue sur Æ, c’est-à-dire si 
f € E*, on appelle ordre de f le plus petit nombre n tel que f € E*: 
en vertu de l'égalité (10), toute fonctionnelle linéaire continue sur 
E est d'ordre fini. 


Exercice. 1 Démontrer que dans un espace dénombrablement normé, 
quels que soient deux éléments x, £ z2, il existe une fonctionnelle linéaire con- 
tinue qui les sépare. 

2. Démontrer la même proposition pour un espace localement convexe 
quelconque. 
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$ 2. Espace dual 


1. Définition de l’espace dual. Pour les fonctionnelles linéaires 
on peut définir les opérations d’addition et de multiplication par 
un nombre. Soient /, et f, deux fonctionnelles linéaires sur un espace 
vectoriel Æ. Leur somme f, + f, est, par définition, la fonctionnelle 


fa) =h(G)+f@), 2zeE. 


On appelle produit af, de la fonctionnelle linéaire f, par le 
nombre « la fonctionnelle 


f(x) = af G&), zeE. 


Les égalités qui définissent f, + f, et af, peuvent s’écrire encore 
ainsi : 


a + fe) (x) = fa (x) + f2 (x), (afi) (x) = af: (x). 


Il est clair que la somme f, <- f, et le produit «/, sont des fonc- 
tionnelles linéaires. Si, en outre, l’espace Æ est topologique et les 
fonctionnelles f, et f, sont continues sur £, alors f, + f, et af, le 
sont également. 

Il est aisé de vérifier que les opérations sur les fonctionnelles 
linéaires, définies ci-dessus, satisfont à tous les axiomes de l’espace 
vectoriel. Autrement dit, l’ensemble des fonctionnelles linéaires 
continues, définies sur un espace vectoriel topologique, constitue un 
espace vectoriel. On l’appelle dual de l’espace E et on le note E*. 


Exercice. L'ensemble de toutes les fonctionnelles linéaires sur £, 


non nécessairement continues, est appelé dual algébrique de l'espace E et noté E* 
Donner un exemple d’espace vectoriel topologique £ tel que 


E* £ EF 


Dans l’espace dual E* on peut introduire une topologie de dif- 
férentes façons. Parmi Loutes les topologies de £* les plus importantes 
sont la topologie forte et la topologie faible. 

2. Topologie forte sur l’espace dual. Commençons par le cas 
le plus simple, où l’espace initial Æ est normé. Pour les fonctionnelles 
linéaires continues, définies sur un espace normé, nous avons intro- 
duit la notion de norme, en posant 


[F1 = sup HE 
x 0 zx |] 


Il est aisé de voir que ||f|| vérifie toutes les conditions contenues 
dans la définition de la norme. En effet, 
4) [fI1l> 0 pour toute fonctionnelle linéaire non nulle f, 


2) Iafll = Ta le fl, 
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3) |fi+f2ll= sup HO+rRO! Su up LA G)| + 
x=£0 Il x || x-0 [| æ . 


+ sup Le = |} #5 11 + 11 fe (le 


Par conséquent, le dual E£* d’un espace normé peut être muni de 
façon naturelle d’une structure d'espace normé. La topologie de E* 
qui correspond à la norme introduite ci-dessus s'appelle topologie 
forte de E*. S'il faut souligner que l’espace E* est considéré comme 
un espace normé, nous écrirons (£*, ||-||) au lieu de ÆE*. 

Démontrons la proposition suivante qui exprime une propriété 
importante du dual d’un espace normé. 


Théorème 1. L'espace dual (E*, [|-|]) est complet. 


Démonstration. Soit {f,} une suite de Cauchy de fonc- 
tionnelles linéaires. Alors pour tout e > 0 il existe N tel que 
[fn — fmll < € pour tous les n, m < N. On en déduit que pour 
tout € E on a 


[fn () — fm @) Ka — fnllel xl < ell if, 


ce qui signifie que pour tout x € E la suite numérique {f, (x)} est 
convergente. 
Posons 


f(x)= lim fr (x) 


et montrons que f est une fonctionnelle linéaire continue. La linéa- 
rité est immédiate : 


f (ax + y) = lim În (ax + By) — lim [afn (Z) + Bfn (y)1 = af (x) + Bf (y). 


Pour démontrer la continuité de la fonctionnelle f reprenons 
l'inégalité | fn (&) — fm (x) | < ell x] et passons à la limite pour 


m—> oo: il vient 
| f (x) — fn @) 1 < ell xil. 


On en déduit que la fonctionnelle f — f, est bornée. Mais alors la 
fonctionnelle f — f, + (f — f,) est aussi bornée et donc continue. 
Du même fait il résulte encore que || f — f,|| & £& pour tous les 
n > N, c'est-à-dire que {f,} converge vers f 

Le théorème est démontré. 

Soulignons encore une fois que ce théorème est vrai indépen- 
damment du fait que l’espace initial est complet ou non. 


Remarque. Si l'espace E n'est pas complet et E est son com- 
plété, alors les espaces E* et (E)* sont isomorphes. 

En effet, l'espace E étant inclus dans Æ£ comme un sous-ensemble 
partout dense, toute fonctionnelle linéaire f, continue sur Æ, peut 


12—0167 
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être prolongée par continuité de E à l'espace £ tout entier. Désignons 
ce prolongement (unique !) par f. Il est clair que f € (E)*, [| fl ={1fI 


et que toute fonctionnelle de (£)* est le prolongement d’une fonction- 
nelle de E* (plus précisément, de sa restriction à Æ£). Par conséquent, 
l'application f— f est un isomorphisme de l’espace E* sur l’espace 
(E)*. 

Définissons maintenant la topologie forte sur le dual d’un espace 
vectoriel topologique arbitraire. Dans le dual d’un espace normé, 
nous avons appelé voisinage de zéro un ensemble de fonctionnelles 
vérifiant la condition 


III << ee 


Autrement dit, dans l’espace £*, dual d’un espace normé, on prend 
pour voisinages de zéro les ensembles de fonctionnelles f telles que 
| f (x) | < e, lorsque x parcourt dans Æ la boule unité [x || < 1. 
Si & varie, ces ensembles forment un système fondamental de voisi- 
nages de zéro. Dans le cas où £ est un espace vectoriel topologique 
non normé, il est naturel de prendre au lieu de la boule unité un 
ensemble borné arbitraire À € £. 

Un voisinage de zéro U ,, À dans E* est, par définition, l’ensemble 
des fonctionnelles linéaires vérifiant la condition 


| f (x) | Le pour tous les x € À. 


En faisant varier & et À, on obtient un système fondamental de 
voisinages de zéro dans E*. 

Ainsi, la topologie forte de E* est donnée par un système de voisina- 
ges de zéro qui dépendent du réel positif e et de l’ensemble borné 
AC E. Nous n’allons pas vérifier ici, bien que cela ne soit pas difficile 
(cf., par exemple, [9]), qu’un tel système de voisinages confère 
bien à £* une structure d'espace vectoriel topologique. 

Il est clair que dans le cas d’un espace normé Æ la topologie 
forte de E*, définie ci-dessus, coïncide avec celle qui est définie 
par la norme. 

Notons que la topologie forte de E* est nécessairement séparée 
et localement convexe (indépendamment de la topologie de Æ). 
En effet, si fo € E* et fo 5 0, il existe un élément x, € E tel que 


1 
fo (xo) Æ 0; posons & =] fo (to) let À = {xo}; alors fo é Ue, 4, 


c'est-à-dire Æ* est séparé. Pour démontrer que la topologie forte 
de Æ* est localement convexe, il suffit de remarquer que pour tout 
e > 0 et tout ensemble borné À € E le voisinage U,, 1 est convexe 
dans Æ. Nous désignerons la topologie forte de Æ* par le symbole b. 
Lorsqu'il faudra préciser que l’espace Æ£ est considéré avec sa topo- 
logie forte, nous écrirons (E*, b) au lieu de E*. 
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3. Exemples d’espaces duals. 

4. Soit Æ un espace vectoriel à r dimensions (réel ou complexe). 
Une base quelconque e;, . .., e, de cet espace étant choisie, tout 
vecteur x € E peut être representé de façon unique sous la forme 

n 


z= > ze; Si f est une fonctionnelle linéaire sur E, il est clair que 
i=1 


f(x) = à f (ei) i. (1) 


Donc, une fonctionnelle linéaire est définie de façon unique par 
ses valeurs pour les vecteurs de la base e,, . .., e,, ces valeurs 
pouvant être données arbitrairement. Introduisons les fonctionnelles 
linéaires g4, . .., £n, en posant 

1, Si i-)j, 


gen = | 0, si ij. 


Il est évident que ces fonctionnelles sont linéairement indépendantes. 
Il est clair, d’autre part, que g; (x) — x;, de sorte que la for- 
mule (1) peut s’écrire sous la forme 


ñn 
f (x) = À f (ei) gi (x). 

On en conclut que les fonctionnelles g4, . . ., g, forment une base 
de l’espace E* ; donc, £* est un espace vectoriel de dimension 7. 
La base g;, Lo ..., £n de E* s'appelle base duale de la base 
Ej, + ++ En de E. 

Des normes différentes définies sur l’espace £ induisent des nor- 
mes différentes sur E*. Voici quelques exemples de couples de normes 


sur E et sur E* qui se correspondent (on recommande au lecteur 
d'effectuer soigneusement les démonstrations nécessaires) : 


L 2\ 122 : 2) 1/2. 
@) Iel=(Zlar) , nf (D AP) 
b) Izl=(SixP)? = (Dr)" 
1—=1 
+= t, 1<p< 00: 
GC) lzl= sup læl 1f1= 21%: 


nr 
d) Hzl=2>lxl If sup 1f| 
1—1 1<i<n 
12* 
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Dans ces formules x, . .., x, désignent les coordonnées du 
vecteur x € E par rapport à la base e;, ...,e, et f1, . .., fn dé- 
signent les coordonnées de la fonctionnelle f € E* par rapport à la 
base duale g,, ..., gne 


Exercice. Démontrer que toutes les normes énumérées ici définissent 
sur un espace à n dimensions la même topologie. 


2. Considérons l’espace c, des suites x — (x, æo, . . ., Æn, . . .) 
convergeant vers zéro, muni de la norme ||x || — sup | x, |, et mon- 


n 
trons que son dual (cŸ, ||-[|) est isomorphe à l'espace l, des suites 
f = (fus fos + + +, Îns - . -) absolument sommables, muni de la norme 


If [= > | fn |. Toute suite f € L, définit sur l’espace c, une fonc- 


tionnelle ‘linéaire bornée selon la formule 


F2) = 2 fntn ; (2) 


il est clair que | Ÿ (x) ESIFA) » | fn |, de sorte que 
n—=1 


MAUR 2 ln KI. 


Considérons dans co les vecteurs 


— (1, 0, 0,..., 0, 0, ...), 
— (0, 1, 0,..., 0, 0,. 


en = (0,0,0,...,1,0,...), 


N 
et posons aN= FA En (si În —0, on pose În =0). Alors 


n=1 


2 Eco, Na ET et 


N 
f (a) = (en) = s | fn |, 
n—1 "4 
de sorte que lim (xt) — D [fn | =||7 Il. Par conséquent, 11 > 


OO 


> 2 | fn |; compte tenu de l'inégalité de sens contraire, démon- 
n= 
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trée plus haut, on en déduit que 


Nfl= 2 1fnl= fl 


Ainsi, nous avons construit une application linéaire 
isométrique f—+f de l’espace Z, dans l’espace c*; il reste 
à démontrer que l’image de l’espace /, par cette application coïncide 
avec l’espace cÿ tout entier, c’est-à-dire que toute fonctionnelle 


f Ec* peut s’écrire sous a forme (2) avec f — {fh} € L. Pour tout 


x ={tn} EcCoon a x— > Tnên, OÙ la série figurant au second 
=1 


membre converge dans c, vers l’élément x, car 


z — ÿ Tn£n = sup lan 0 pour À —- co. 


l n=1 
Comme la fonctionnelle f € c; est continue, on a f (x) — > tf (eh) ; 
n—0 


donc, il suffit de montrer que > fl (en) |< oo. En posant 
n—=1 


N 
f (en) 
(N) — = En 
° 2 F(en) 


et en remarquant que aME c, et [|a||<1, on a 
00 N 
2 F1 Z Ten) 7e) 7 (20) EN FIL, 
ni AE n) | 
d’où, puisque Ÿ est arbitraire, on conclut que > |f (en) | oo. 
=1 


n— 

3. Il est facile de démontrer que l’espace l*, dual de L,, est 
isomorphe à l'espace m, formé par les suites “bornées x — {tn} 
et muni de la norme || |] = — SUP [Zn |. 


4. Soit p > 1 et l'espace des suites x — {x,} telles que 


ze (D Ian PP < 


on peut démontrer que l’espace dual 7 est isomorphe à l’espace L, 
{ { . pe . 
ta t Les fonctionnelles linéaires continues sur l, ont la 


forme générale suivante : 


(= À fra: T = {Xn} E lp; f—= {fn} € la. 
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La démonstration est fondée sur l'application de l'inégalité de 
Hôlder. 
5. Etudions la structure du dual d’un espace de Hilbert. 


Théorème 2. Soit H un espace de Hilbert réel. Pour toute 
fonctionnelle linéaire continue f, définie sur H, il existe un élément 
unique xzo € H tel que 


Î (x) — (x, To); x CH, (3) 
et [[fI| = |[|xoll. Réciproquement, si xo € H, la formule (3) définit 
une fonctionnelle linéaire continue f telle que ||fI| = || toll. L'égalité (3) 


définit donc un isomorphisme f — x, entre les espaces H* et H. 


Démonstration. Il est évident que pout tout xo € H 
la formule (3) définit une fonctionnelle linéaire sur H. Comme 
[ff (œ)| = |(x, to) | LI xl: roll, cette fonctionnelle est continue, 
et comme f (xo) —{||xoll, on a ||f|| — |[|xoll. Montrons que toute 
fonctionnelle linéaire continue f, définie sur A, peut être représentée 
sous la forme (3). Si f — 0, on pose xs — 0. Soit donc f 0 et soit 
H; = {x:f (x) = 0} le noyau de la fonctionnelle f; en vertu de la 
continuité de f, Æ, est un sous-espace vectoriel fermé de F4. 
Au n°6, $1, chap. III, nous avons montré que le noyau de toute 
fonctionnelle linéaire est de codimension 1. Compte tenu du corol- 
laire 3 du théorème 7, $4, chap. IIT, on en conclut que le supplémen- 
taire orthogonal H-1 du sous-espace A, est de dimension 1; donc, 
il existe un vecteur (non nul) y, orthogonal à À, tel que tout vecteur 
zx € H peut être mis de façon unique sous la forme x = y + Àyo 
avec Yo € H,. Evidemment, on peut supposer {|| yoll = 1. Posons 
Zo = f (Yo) Yo- Alors pour tout xEHona 


T = y + Ayo y € Ho, 
(x, Zo) = À (Yo, Lo) = Àf (Yo) (Yo, Yo) = Àf (Yo). 


Ainsi, f (x) = (x, xo) pour tous les x € H. Si f (x) — (x, x), æ CH, 
alors (x, To — x) = 0, d’où, en posant x — x — x, on obtient 
que Lo — Lo 

Le théorème est démontré. 

Remarques. 1. Soit £ un espace euclidien non com- 
plet et soit H un espace de Hilbert lui servant de complété. 
Comme les espaces E* et H* sont isomorphes (cf. remarque, page 177) 
et l’espace A* est isomorphe à À, on a le résultat suivant : le dual 
E* d'un espace euclidien non complet E est isomorphe au complété 
H de l'espace E. 

2. Le théorème 2 est vrai également pour un espace de Hilbert 
complexe (la démonstration est exactement la même, pourvu qu’on 


remplace zo = f (Yo) Yo Par to = f (Yo) yo). La seule différence du 
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cas d’un espace réel consiste en ce que maintenant l'application 
de À dans H* qui fait correspondre à tout élément x, € H la fonction- 
nelle f (x) — (x, to) est un isomorphisme linéaire conjugué, c’est-à-dire 
un isomorphisme qui à l'élément Àx, fait correspondre la fonction- 


nelle Af. 

6. Dans les exemples 1-5 nous avons considéré des espaces normés. 
Considérons maintenant un espace dénombrablement normé. Soit ® 
un espace dénombrablement hilbertien réel, constitué par les suites 


x = {1,} telles que 
Ç 1/2 
Izla=(2 na) < 


pour tous les £ = 1, 2, ... et muni des produits scalaires 


(x, Y)a = 2 NF XnYns k=— 1, 2, 
n—= 


L'espace ® avec le produit scalaire (:,‘), est un espace euclidien; 
soit D, son complété. Il est aisé de voir que ®, peut être identifié 
à l’espace de Hilbert constitué par les suites x = {x,} telles que 
| xil: << oo. En vertu du théorème 2, l’espace D, dual de ®,;, 
est isomorphe à l’espace ®D,. Cet isomorphisme fait correspondre 


à toute fonctionnelle linéaire continue f € DË une suite Î — {fn} 
telle que 


LS (D nf P) € 00, 


f(a)= (x, fr = à N'tnfn 


Zz={Xn} ED ; 


inversement, toute suite de cette forme définit un élément de Di. 
Définissons maintenant la fonctionnelle f € DE non à l’aide de la 
suite {f,}, mais à l’aide de la suite {g,}, où g, — n#f,. Alors 


fe À angn et = (D RE) T 


Par conséquent, l’espace D peut être identifié à l’espace de Hilbert 
constitué par les suites {g,} telles que 


> nh gi < (4) 
et muni du produit scalaire 


(g œ g®) = > nn" evo œ, 
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Comme D* = |} D, D* représente l’espace de toutes les suites 


k=1 

{gn} telles que pour chacune d'elles il existe un nombre Æ pour 
lequel cette suite vérifie la condition (4). 

La valeur de chacune de ces fonctionnelles est définie pour 


tout élément x — {r,} E D et est égale à D x,g. 
n=1 


Ainsi, si l’espace ® est l'intersection d’une suite décrois- 
sante d'espaces de Hilbert. 


D= N M, DD... D... 
k=1 


l’espace D* est la réunion d’une suite croissante d'espaces 
de Hilbert 


O0 
Di= U D, icdec...cdie... 


Il est commode d'introduire la notation D£ — ®_,. En désignant 
encore l’espace Z, par D, nous obtiendrons une suite d'espaces de 
Hilbert, infinie dans les deux sens: 


.ch,c...cdhch,cp,c...co,c... 


où DË — D, pour tous les 4 — 0, +1, +2, ... 

4, Espace bidual. Comme les fonciionnelles linéaires continues 
sur un espace vectoriel topologique forment elles-mêmes un espace 
vectoriel topologiques — le dual (Æ*, b) de l’espace E — on peut 
parler aussi de l’espace E** des fonctionnelles linéaires continues 
sur £*, c’est-à-dire de l’espace bidual de E, etc. 

Notons que tout élément x, de Æ définit une fonctionnelle linéaire 
sur É*. En effet, posons 


Pro (7) = (Go); (5) 


où x, est un élément fixé de Æ et f parcourt l’espace E* tout entier. 
L'égalité (5) fait correspondre à chaque f un nombre w.., (f) et définit 
donc une fonctionnelle sur Æ*. Comme, par ailleurs, 


Vo (A f1 + Bf2) = af (ro) + Bf2 (to) = x0 (F1) + BPxo (F2); 


cette fonctionnelle est linéaire. 

De plus, une telle fonctionnelle est continue sur £*. En 
effet, soient & > 0, et À un sous-ensemble borné de Æ contenant 
l'élément x, Considérons dans E* un voisinage de zéro U (e, À). 
D'après la définition de U (e, À) on a 


[Pro (P)I=1f(x0)1<E pour FEU (E, À). 
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Mais cela signifie que la fonctionnelle #,, est continue au point © 
et donc sur l’espace E* tout entier. 

Nous avons obtenu donc une application de l’espace Æ tout 
entier sur une partie de l’espace E**. Cette application est, évidem- 
ment, linéaire. Une telle application de £ dans E** s'appelle appli- 
cation naturelle de l’espace E dans son bidual. Désignons-la par x. 
S'il y a des fonctionnelles linéaires sur £ en quantité suffisamment 
grande (par exemple, si l’espace E est normé ou au moins localement 
convexe et séparé), cette application est biunivoque, car alors pour 
n'importe quels deux éléments distincts à”, x” € E il existe une 
fonctionnelle f € Æ* telle que f (x) = f (x”), c’est-à-dire w%. et W. 
sont des fonctionnelles distinctes sur E*. Si, en outre, x (EE) — E**, 
alors l’espace Æ (localement convexe et séparé) est dit semi-réflexif. 
Dans l’espace E** (comme dual de (E*, b)) on peut introduire la 
topologie forte que nous désignerons par b*. Si l’espace E est semi- 
réflexif et l’application n: E — E** est continue, on dit 
que l’espace E est réflexif. On peut montrer que l'application n°7 
est toujours continue; donc, si l’espace E est réflexif, l'application 
naturelle n: E — E** est un isomorphisme des espaces vectoriels topo- 
logiques E et E** — (E**, b*), 

Puisque maintenant tout élément de Æ peut être considéré aussi 
comme un élément de l’espace E**, il est commode de remplacer la 
notation f (x) des valeurs de la fonctionnelle f € E* par la nota- 


tion plus symétrique : 
f (x) = (f, à). (6} 


Nous pouvons alors considérer (f, x) pour f € E* fixé comme une 
fonctionnelle sur Æ et pour x fixé comme une fonctionnelle sur E* 
(x est alors considéré comme un élément de E**). 

Si E est un espace normé (alors les espaces E*, E*%*, etc. sont 
aussi normés), l’application naturelle de l’espace E dans son bidual 
E** est une isométrie. 

En effet, soit x un élément de Æ. Désignons sa norme sur Æ£ 
par le symbole || x|| et la norme de son image dans £** par le symbole 
I] x|l. Montrons que || x|| = || x|l. Soit f un élément non nul quel- 
conque de Æ*. Alors 


[CG +) c.-à-d. el 


et, puisque le premier membre de la dernière inégalité ne dépend 
pas de ÿ, on a 
Mel >suplo le ape 


D'autre part, en vertu du théorème de Hahn-Banach, pour tout 
to € E il existe une fonctionnelle linéaire non nulle f, telle que 


| Go Zo) | = 1 foll-1 Zoll 
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(pour construire une telle fonctionnelle, il suffit de poser fo (x) = 
— à =£ O0 pour les éléments de la forme x — ax, et prolonger ensuite 
cette fonctionnelle à l’espace Æ tout entier, en conservant sa norme). 
De l'égalité (7) il résulte que 


Ixlle=sup HOLD x: 
fEE* Il Il 
par conséquent, || x|| —|| x|l:, ce qu’il fallait démontrer. Ainsi donc, 
si £ est un espace normé, il est isométrique à la variété linéaire (en 
général, non fermée) x (£) de E**. En identifiant £ et x (E), on 
peut considérer £ comme une partie de E**. 

Du fait que pour les espaces normés l'application naturelle x: 
E — E** est isométrique, il résulte que pour ces espaces la notion 
de semi-réflexivité et celle de réflexivité coïncident. 

Comme le dual d’un espace normé est toujours complet, on 
conclut que tout espace normé réflexif E est complet. 

Les espaces euclidiens de dimension finie et les espaces de Hilbert 
représentent les exemple les plus simples d’espaces réflexifs (pour 
ces espaces on à même £ — E*). 

L'espace c, des suites convergeant vers zéro constitue un exemple 
d'espace non réflexif complet. En effet, comme nous l’avons montré 
plus haut (exemple 2, n° 3), le dual de c, est l’espace Z, de toutes 
les suites numériques absolument sommables qui, à son tour, a pour 
dual l’espace m de toutes les suites bornées. 

L'espace C La, b] des fonctions continues sur un segment [a, b] 
est également non réflexif. Mais nous ne donneronsici aucune démons- 
tration de ce fait ?). 

Un exemple d'espace réflexif ne coïncidant pas avec son dual 
est fourni par l’espace L, pour 1 << p 2 (comme [5 = l, où 


++i=tonam=%=1) 


Exercice. Démontrer qu’un sous-espace fermé d’un espace réflexif est 
aussi réflexif. 


$ 3. Topologie faible et convergence faible 


1. Topologie faible et convergence faible dans un espace vectoriel 
topologique. Considérons un espace vectoriel topologique £ et l’en- 
semble de toutes les fonctionnelles continues sur cet espace. Si 
f1, -. ., fn est un système fini quelconque de telles fonctionnelles 
et € est un réel positif, alors l’ensemble 


{fi (l<e;i=1,2,..,n) (1) 


1 On peut démontrer même une proposition plus forte: il n’existe aucun 
espace normé dont le dual soit l’espace C' [a,b]. 
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est ouvert dans Æ et contient le point 0, c’est-à-dire constitue un 
voisinage de zéro. L'’intersection de deux voisinages de cette espèce 
contient toujours un ensemble de la forme (1); par conséquent, 
dans £ on peut introduire une topologie, pour laquelle les ensembles 
de la forme (1) constitueront un système fondamental de voisinages 
de zéro. On l’appelle fopologie faible de l’espace E. La topologie 
faible de Æ c’est la plus faible des topologies par rapport auxquelles 
toutes les fonctionnelles linéaires, continues par rapport à la topologie 
initiale de Æ, sont aussi continues. 

Il est clair que tout sous-ensemble de Æ, ouvert au sens de la 
topologie faible, est ouvert aussi par rapport à la topologie initiale 
de l’espace E, mais la réciproque est en général fausse (les ensembles 
de la forme (1) ne constituent pas nécessairement un système fonda- 
mental de voisinages de zéro pour la topologie initiale). Suivant 
la terminologie adoptée au $5, chap. II, cela signifie que la topologie 
faible de l’espace E est plus faible que sa topologie initiale. 
Ceci justifie le nom qu'on lui a donné. | 

S’il y a des fonctionnelles linéaires continues sur E en quantité 
suffisamment grande (par exemple, si l’espace Æ est normé), la 
topologie faible de Æ vérifie l’axiome de séparation de Hausdorff. 
Il est aisé de vérifier aussi que les opérations d’addition et de multi- 
plication par un nombre, définies dans Æ, sont continues par rapport 
à la topologie faible de cet espace. 

Même dans le cas d’un espace normé la topologie faible de Æ 
peut ne pas vérifier le premier axiome de dénombrabilité. Par con- 
séquent, cette topologie ne peut pas être formulée, en général, en 
termes de suites convergentes. Tout de même, la convergence dans 
E, définie par cette topologie, constitue une notion importante que 
l’on appelle convergence faible. Pour être discernée de cette dernière, 
la convergence, définie par la topologie initiale de l’espace Æ (par 
la norme, si Æ est normé), est appelée convergence forte. 

La notion de convergence faible peut être formulée de la manière 
suivante: une suite {x,} d'éléments de £ est dite faiblement con- 
vergente vers Zo € E, si pour toute fonctionnelle linéaire continue 
@ (x) sur Æ la suite numérique { (x,)} converge vers œ (xo). 

En effet, posons, pour simplifier les raisonnements, x, = 0 et 
supposons que @ (x) — 0 pour tout @ € E*. Alors pour tout voisi- 
nage faible 


U = {x [p(i)|l<e, i=1,2,...,k} 


du point O il existe N tel que x, € U pour tous les n > N (pour le 
trouver il suffit de choisir V; de façon que |; (x,) | < £ pour 
n > N; et prendre VN = max N;). Inversement, si à tout voisinage 
faible de zéro U on peut associer un nombre tel que x, € U pour 
tous les r > N, la condition @ (x,) — 0 pour ñn —- œ est évidemment 
remplie pour chaque @ € E* fixé. Du fait que la topologie faible 
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de l'espace £ est plus faible que sa topologie forte on déduit que 
toute suite fortement convergente est aussi faiblement convergente. 
La réciproque est, en général, fausse (voir les exemples ci-dessous). 

2. Convergence faible dans un espace normé. Examinons d'une 
façon plus détaillée la notion de convergence faible pour le cas d’un 
espace normé. 


Théorème 1. Si {x,} est une suite faiblement convergente 
d'un espace normé, il existe une constante C telle que 


lan < C: 


Autrement dit, dans un espace normé, toute suite faiblement con- 
vergente est bornée. 
Démonstration. Considérons dans Æ£* les ensembles 


An — {f: | (Zn) | LH}. 
Azn est fermé en vertu de la continuité de f (x,) comme fonction 
de f pour x, fixé. Par conséquent, les ensembles 


Az — n, An 


sont aussi fermés (comme intersections de fermés). Il est aisé de voir 
que 


E*= |) 4. 
k=1 


Puisque E* est complet, d’après le théorème de Baïre ($ 3, chap. II) 
il existe un ensemble 44, dense dans une boule S [fo, el. Mais 
Ar est fermé; c'est pourquoi 


S { fo» e] CC Apo 


D'après la définition de A4x,, la suite {x,} est bornée dans la boule 
S (fo, el. Cela implique qu'elle est bornée aussi dans la boule 
S [0, el — {g:|| gl Le}. En effet, si gEST[0, el, alors fo + 
+ £ € S (fo: el. Or, (g; Tn) — (Jo + £ Tn) (Jo: Tn) et les nombres 
(fo> Zn) forment une suite bornée, grâce à la convergence faible de 
la suite {x,}. Mais, comme l'application naturelle de Æ dans £** 
est isométrique, si | (g, x,) | & C pour tous les g€ S[0, e,on a 


Ian, 


c'est-à-dire les normes || x,|| forment un ensemble borné. 
Le théorème est démontré. 


Remarque. Pour démontrer que la suite {x,} est bornée en norme nous 
avons utilisé seulement le fait que la suite numérique (f, x,) est bornée pour cha- 
que f € E*. Donc, si la suite {x, } de E est telle que la suite numérique (f, x,) est 
bornée pour tout f € E*, ilexiste une constante C telle que [|x, || < C. Ce résul- 
tat peut être généralisé : dans un espace normé E tout ensemble Q faiblement borné 
(c'est-à-dire borné au sens de la topologie faible) est aussi fortement borné (c'est- 
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à-dire contenu dans une boule). En effet, supposons qu’il existe une suite {x,}e 
« @ telle que ||x,||—- oo quand n —+ ©. Comme l’ensemble Q est faiblement 
borné, il en est de même de l’ensemble {x,}, c’est-à-dire cet ensemble est absor- 
bé par tout voisinage faible de zéro; en particulier, pour tout f € E* il existe N 
tel que 
{a} N {x|(f,x) | <1}, d'où |(f, x,) | <N 

pour tous les n. Mais, en vertu de la remarque ci-dessus, cela contredit l'hypothèse 
que ||x,|l— co. Si l’on tient compte du fait qu’un ensemble © est faiblement 
borné si et seulement sitoute fonctionnelle linéaire continue est bornée dans Q, 
on aboutit au résultat suivant: pour qu'un sous-ensemble Q d'un espace normé 


soit borné, il faut et il suffit que toute fonctionnelle f € E* soit bornée 
dans Q 


Le théorème qui suit est souvent utile, lorsqu'il s’agit de véri- 
fier effectivement, si une suite donnée quelconque est faiblement 
convergente. 


Théorème 2. Une suite {x,} d'éléments d'un espace normé 
E converge faiblement vers x € E, si: 

1) Les nombres || x, || sont majorés dans leur ensemble par une cons- 
tante M ; 

2) f (Zn) —- f (x) pour tout f € À, où À est un ensemble dont l’en- 
veloppe linéaire est partout dense dans E*. 


Démonstration. De la condition 2) et la définition 
des opérations sur les fonctionnelles linéaires il résulte que si q est 
une combinaison linéaire d'éléments de A, alors 


P (in) + @ (x). 


Soit @ un élément arbitraire de £* et soit {px} une suite 
de combinaisons linéaires d'éléments de A convergeant vers +. 
Montrons que @ (x,) — @ (x). Soit M tel que 


IRIS M (R=1,2,...) et [xl < A. 


Evaluons la différence | (x,) — @ (x) |. Comme x — 9, 
à tout € >> O0 on peut associer un nombre Æ tel que || ® — @,|| > € 
pour tous les 4 > K. On a donc 


| p (2x1) — p G@) | | (tn) — x (tr) | + | x (tn) — Pr (x) | + 
+ pr @) — PGI EM + EM + Lou (tr) — px (x) |. 


Mais, par hypothèse, x (x) — x (x), lorsque nr — oc. Donc, 
P (Zn) — p (x) — 0 pour r —+ ©, quel que soit p € E*. 
Exemples. On se propose d’éclaircir la signification de 
la notion de convergence faible dans quelques espaces concrets. 
4. La convergence faible dans l'espace euclidien de dimension 
finie R7. Elle coïncide avec la convergence forte. En effet, soit 
4, « « ., €, une base orthonormée quelconque de l’espace R” et soit 
{x,} une suite de R”, faiblement convergente vers l'élément x. 
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Soient encore 


TR = TR € +... + Afen, 
et 
zx Ve t...tLrves 
Alors 
Th = (xx, €) (x, e)= 2x, 


(n) (n) 
TR — (Tr, En) ne (x, En) = 1" , 
c'est-à-dire la suite {x,} converge en coordonnées vers x. Mais alors 


n 
px 2 = (D (ci —at})" +0, 

c'est-à-dire la suite {x,} converge fortement vers x. Comme la 
convergence forte implique toujours la convergence faible, l’équiva- 
lence de ces deux convergences dans R” est démontrée. 

2. La convergence faible dans l,. Pour qu’une suite bornée 
{x,} soit faiblement convergente vers x, il suffit que les conditions 
suivantes soient remplies: 


(an, er) = 2 + x (x, e;), i—1, 2, ..., 


a =(1,0,0,...) 6 — (0,1, 0,...), ... 


En effet, les combinaisons linéaires des éléments e; sont partout 
denses dans l’espace /, (qui coïncide, comme nous l’avons vu, avec 
son dual). C’est pourquoi notre affirmation découle du théorème 2. 

Aïnsi, la convergence faible d’une suite bornée {x,} dans l» 
signifie que la suite numérique z% des coordonnées de ces vecteurs 
converge pour chaque i = 1, 2, . .. Autrement dit, la convergence 
faible coïncide avec la convergence en coordonnées (à condition 
que la suite soit bornée). 

Il est aisé de voir que dans /, la convergence faible ne coïncide 
pas avec la convergence forte. En effet, montrons que la suite 
y, C9, + + + En, . . . dans /, converge faiblement vers 0. Toute 
fonctionnelle linéaire f sur /, peut être représentée par le produit 
scalaire f(x) — (x, a) du vecteur x El» par un vecteur fixé 
a —= (ai, &2, . ..). Par conséquent, 


f (en) — Un 
et, puisque a, —+ 0 quand nr —+ œ pour tout a € l,, on obtient 
Nc 
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pour toute fonctionnelle linéaire sur Le. 
Pourtant, la suite {e,} ne converge fortement vers aucune limite. 


Exercices. 1. Soit {xr, } une suite d'éléments d’un espace de Hilbert H 
convergeant faiblement vers un élément x et telle que |x, |--I| z|] pour n — co. 
Démontrer que dans ces conditions la suite {x,} converge fortement vers x, 
c'est-à-dire que ||xz, — xl — 0. 

2. Démontrer que l’affirmation de l’exercice 1 demeure vraie, si l’on rem- 
place la condition |x,|| — || z|| par la condition |[x, || < || x|| pour tous les n, 
ou par la condition lim ||x, || < ||zil. 

N—+ 00 


3. Soient H un espace de Hilbert (séparable), et Q un sous-ensemble borné 
de H. Alors la topologie de @, induite par la topologie faible de l’espace Æ, peut 
être définie à l’aide d’une métrique. 

&. Démontrer que tout sous-ensemble fermé convexe d’un espace de 
Hilbert est fermé pour la topologie faible (en particulier, tout sous-espace vecto- 
riel fermé d’un espace de Hilbert est faiblement fermé). Donner un exemple 
d'ensemble fermé dans un espace de Hilbert qui ne soit pas faiblement fermé. 


3. La convergence faible dans l’espace C La, b] des fonctions continues. 
Soit {x, (t)} une suite de fonctions de C [a, b] convergeant faible- 
ment vers une fonction x (£). La suite {x, (t)} est bornée par rapport 
à la norme de C [a, bl. Parmi les fonctionnelles définies sur C [a. b] 
considérons, en particulier, les fonctionnelles ô;, dont chacune fait 
correspondre à toute fonction sa valeur en un point fixé £, (cf. exemple 
4, n° 2, $ 1). Pour chacune des fonctionnelles Ô4, la condition 


Oro (Tr) —+ Oto (X) 
signifie que 


Zn (to) + x (bo). 


Donc, si la suite {x, (t)} est faiblement convergente, elle est : 

Î) uniformément bornée, c’est-à-dire | x, (é) | < C pour tous les 
n—=1,2,...eta<t<b; 

2) convergente en chaque point. 

On peut montrer que ces deux conditions sont non seulement 
nécessaires, mais aussi suffisantes pour que la suite {x, (t)} 
soit faiblement convergente dans C [a, b]. Autrement dit, la conver- 
gence faible dans C [a, b] coïncide avec la convergence ponctuelle 
(à condition que la suite soit bornée). 

Il est clair que cette convergence ne coïncide pas avec la conver- 
gence au sens de la norme de C Îla, b], c’est-à-dire avec la convergence 
uniforme des fonctions continues. (Donner un exemple illustrant ce 
fait.) 

3. Topologie faible et convergence faible dans l’espace dual. 
Au n° 4 du paragraphe précédent nous avons introduit dans l’espace 
dual E* une topologie, que nous avons appelée topologie forte, en 
prenant pour système de voisinages de zéro la famille des ensembles 
de la forme 


Usa ={flf()l<e, xEA}, 
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où À est un ensemble borné quelconque de Æ et & est un réel positif 
arbitraire. Si au lieu de tous les ensembles bornés on considère ici 
tous les sous-ensembles finis AE, on obtient la topologie, 
dite topologie faible de l’espace dual E*. Comme tout ensemble fini 
AC E est en même temps borné (la réciproque est, en général, faus- 
se), il est clair que la topologie faible de l’espace E* est plus faible 
que sa topologie forte. En général, ces deux topologies ne coïncident 
pas. 

La topologie faible, introduite dans Æ*, définit dans cet espace une 
convergence dite convergence faible des fonctionnelles. La convergence 
faible des fonctionnelles linéaires est une notion importante qui joue 
un rôle considérable dans beaucoup de questions de l’analyse fonc- 
tionnelle, et en particulier, dans la théorie des distributions, dont 
il sera question au paragraphe suivant. 

La convergence faible d’une suite {p, } de fonctionnelles linéaires 
coïncide, évidemment, avec la convergence de cette suite pour cha- 
que élément fixé de l’espace E. En d’autres termes, la suite {p,} 
est dite faiblement convergente vers @ € E*, si pour chaque x € E 
on à 


Pn (x) —+ p (x). 


Il est clair que dans l’espace dual, comme dans l’espace initial, toute 
suite, convergente pour la topologie forte, est aussi faiblement con- 


vergente (mais pas inversement). 
Soit Æ (donc, £* aussi) un espace de Banach. On a le théorème 


suivant, analogue au théorème 1. 


Théorème 1*. Si {f,} est une suite faiblement convergente de 
fonctionelles linéaires sur un espace de Banach, il existe une constante C 


telle que 
fl C, n —= 1,2, ... 


Autrement dit, toute suite faiblement convergente d'éléments du dual 


d'un espace de Banach est bornée en norme. 
La démonstration ne diffère en rien de celle du théorème 1. 
Le théorème suivant est parfaitement analogue au théorème 2. 


Théorème 2*. Une suite de fonctionnelles linéaires {p,} de 
E* converge faiblement vers @® € E*, si: 
1) cette suite est bornée, c'est-à-dire 


Il Enll < C, n —=1,2,...; 


2) la relation (p,, x) —+ (@, x) est vérifiée pour tous les x apparte- 
nant à un ensemble dont l'enveloppe linéaire est partout dense dans E. 
La démonstration est la même que celle du théorème 2. 
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Considérons un exemple. Soit Æ l’espace des fonctions con- 
tinues C [a, bl?) et soit 


p (x) = x (0), 
ce qui signifie que œ est la fonction 6 (cf. $ 1, n° 2, exemple 4). Soit, 


d'autre part, {p, (t)} une suite de fonctions continues vérifiant les 
conditions suivantes : 


1) n()=0 pour [>+, pr ()>0; 
b 
2) | En (dt=1. 


a 


Alors pour toute fonction zx ({), continue sur [a, b], on obtient à 
l’aide du théorème de la moyenne: 


b 1/n 
| On (£) x (t) dt — | On (£) z(t) dt — x (0) pour n — 0. 
a —1/n 


L'expression 
b 
À En (6) & (8) dé 
a 


est une fonctionnelle linéaire sur C la, b]. Aïnsi, la fonction 6 peut 
être représentée comme la limite, au sens de la convergence faible 
des fonctionnelles linéaires sur C [a, b]l, d’une suite de fonctions 
« habituelles ». 

Remarque. L'espace E* des fonctionnelles linéaires sur un 
espace Æ admet deux interprétations : ou bien il est considéré comme 
le dual de l’espace initial Æ, ou bien ÆE* est considéré comme espace 
de base et alors on lui attache son dual E**. Cela signifie que nous 
pouvons introduire dans £* la topologie faible de deux manières 
différentes : ou bien comme dans l’espace des fonctionnelles, en défi- 
nissant les voisinages dans £* à l’aide des sous-ensembles finis de £, 
ou bien comme dans l’espace de base, à l’aide de l’espace dual E**. 
Dans le cas d’un espace réflexif cela revient, bien sûr, au même. 
Si, par contre, l’espace £ n’est pas réflexif, ce sont deux topologies 
différentes sur £*. Pour éviter toute ambiguïté, la topologie faible, 
définie sur l’espace de base (c’est-à-dire la topologie sur ÆE*, définie 
à l’aide de Æ£**), sera appelée simplement fopologie faible, tandis que 
la topologie faible sur l’espace des fonctionnelles (c’est-à-dire la topo- 
logie sur E*, définie à l’aide de Æ) sera appelée topologie +-faible. 
Il est évident que la topologie +-faible de l’espace E* est plus faible 


1) Nous considérons le point 0 comme appartenant à [a, b]. Au lieu de t — 0 
on pourrait considérer, bien sûr, n'importe quel autre point. 


13—0167 


194 FONCTIONNELLES ET OPÉRATEURS [Ch. IV 


que la topologie faible de Æ (c’est-à-dire la topologie faible contient 
au moins autant d’ensembles ouverts que la topologie +-faible). 

4, Ensembles bornés dans l’espace dual. Dans beaucoup d’applica- 
tions de la notion de convergence faible des fonctionnelles linéaires 
un rôle important revient au théorème suivant. 


Théorème 3. Si E est un espace vectoriel normé séparable, 
toute suite bornée de fonctionnelles linéaires continues sur E contient 
une sous-suite faiblement convergente. 


Démonstration. Choisissons dans Æ£ un ensemble dé- 
nombrable et partout dense (x1, Ze, . . ., Æn, . . .). Si {@,} est une 
suite bornée (en norme) de fonctionnelles linéaires sur £, la suite nu- 
mérique 

4 (ta), Pa (xx), + +, Pa (ti), 


est bornée. C’est pourquoi de {p,} on peut extraire une sous-suite 
Ps Par +. Pr 
telle que la suite numérique 
pi (tu), pe (a), +, On (ai), 


soit convergente. Ensuite, de {p{1)} on peut extraire une sous-suite 


(2) 


(2) (2) 
Pas Pa 9 rs ns -.. 


telle que la suite numérique 


pi” (2), ps” (T2), ….. Ph” (Lo). .….. 


soit convergente. En répétant ce procédé, nous obtiendrons un sys- 


tème de suites 
(1) 


D A) 
ON (] Po 9 CE] .s On , CRC . 


pe? Ds” Pr” 
Ds Po» +. , 
(dont chacune est contenue dans la précédente) tel que la suite {q{*} 


est convergente en chacun des points xi, Zo, . . ., x,. En prenant la 


« diagonale » 
(2) (nm) 


(D 
D, Po”, +. Pr +, 
on obtient une sous-suite de fonctionnelles linéaires telle que la suite 
numérique 


(0) (Zn); Pr” (Zn). °** 
est convergente pour tous les n. Mais alors (d’après le théorème 2*) 


la suite (1) (x), p(2) (x), . . . est convergente aussi pour tout z € £. 
Le théorème est démontré. 


$ 3] TOPOLOGIE FAIBLE ET CONVERGENCE FAIBLE 195 


Ce théorème signifie, compte tenu du théorème 1*, que dans l’es- 
pace E*, dual d’un espace de Banach séparable, les ensembles bornés, 
et ceux-là seulement, sont dénombrablement précompacts pour la 
et non seulement précompacité dénombrable. 

Tout d’abord démontrons le théorème suivant. 


Théorème 4. Soit S* la boule unité fermée de l’espace E*, 
dual d’un espace normé séparable E. La topologie, induite dans S* 
par la topologie +-faible de l’espace E*, peut être définie à l’aide de la 
métrique 


p(, 8) =22"|(f—8, zn)|, (2) 


où {x, } est un ensemble dénombrable fixé quelconque, partout dense dans 
la boule unité S de l’espace E. 


Démonstration. Il est clair que la fonction po (f, g) 
jouit de toutes les propriétés de la distance ; en outre, elle est invarian- 
te par rapport aux translations: 


pF+h g+h) = 0 (f, 8). 


Par conséquent, il suffit de vérifier que la famille de voisinages 
de zéro, définie dans S* par la topologie faible de l’espace E*, est 
équivalente à la famille de voisinages de zéro, définie dans S* par 
la distance (2); autrement dit, il suffit de vérifier que a) toute 


« boule » 
Q: — {:p(7, 0) < e} 


contient l'intersection de S* et d’un certain voisinage faible de zéro 
dans £* et que b) tout voisinage faible de zéro dans £* contient l’in- 
tersection de S* et d’un certain Q.. 


Choisissons W de façon que 27N < _ et considérons le voisinage 
faible de zéro 


VV een { Fm), 212, N). 
Alors, si f ES* NV, on a 


N 00 
PO 0)= 22710 a)+ À 27 an) & 
n=1 n=N+1 
N N 
ë -n -n 
n=1 n=N+1 


c'est-à-dire S* AVE Q:. Ceci prouve l'affirmation a). Démontrons 
l'affirmation b). Soit 


U=U,, y: {f:1(f, yr)| 6, k = 1, 2, .. m} 
13* 
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un voisinage +-faible de zéro quelconque dans E£*. On peut supposer 


que || ya | < 1, & = 1,2, ..., m; comme l’ensemble {x,} est par- 
tout dense dans S, il existe des numéros n;, ..., n, tels que || y; — 
an MK, k=1,2,..., m. Soient N = max (n, ..., 7»), 


et e = 2-W+#)8, Alors, pour f € S* AN Q., des inégalités 


D 27] an) <e 


on obtient que |(f, x,)| << 2e; en particulier, 
1, tn,)| < Dre LD" e = © 
Par conséquent, pour tous les 4 — 1, 2,..., mon a 


LG 11 an) IH, van) À HIS elle — an < 6. 


Ainsi donc, S* AQ.c U. 

Le théorème est démontré. 

Il est clair que ce résultat s'étend automatiquement à toute boule, 
donc à tout sous-ensemble borné M FE*. 

Nous avons montré (théorème 3) que de toute suite bornée d'’élé- 
ments de E* on peut extraire une sous-suite +-faiblement convergente. 
Autrement dit, dans le dual £* d’un espace vectoriel normé séparable, 
muni de la topologie +-faible, tout ensemble borné M est dénombra- 
blement précompact. Mais, en vertu du dernier théorème, tout en- 
semble de ce type constitue un espace topologique métrisable. Or, 
pour les espaces métriques les notions de compacité et de compacité 
dénombrable coïncident. On obtient donc le résultat suivant. 


Théorème 3*. Tout ensemble borné M de l'espace E*, dual 
d'un espace normé séparable, est précompact au sens de la topologie 
*-faible de l’espace E*. 

Montrons maintenant que si £ est un espace vectoriel normé 
et séparable, toute boule fermée de l’espace (E£*, b) est fermée pour 
la topologie +-faible de l’espace E*. 

Comme dans l’espace E* toute translation transforme les ensem- 
bles fermés (relativement à la topologie +-faible) en ensembles fer- 
més, il suffit de démontrer que toute boule de la forme S* — 
= {j:|| f | Lc} est fermée pour la topologie +-faible. Soit f, é Sé. 
D'après la définition de la norme d'une fonctionnelle, il existe un 
vecteur x € E tel que [| x || — 1, fo (x) = « > c. Alors l’ensemble 


U = 4 ff (x) > ae est un voisinage +-faible de la fonctionnel- 


le f, ne contenant aucun élément de la boule S£; par conséquent, la 
boule S* est fermée pour la topologie +-faible. 
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De l’assertion démontrée et du théorème 3* on déduit le théorème 
suivant. 


Théorème 95. Dans l’espace dual d’un espace normé séparable 
toute boule fermée est compacte au sens de la topologie +-faible. 
Les résultats exposés plus haut sur les ensembles bornés dans l’espace dual 


peuvent être étendus des espaces normés aux espaces localement convexes arbi- 
traires. À ce sujet voir, par exemple, [42]. 


$ 4. Distributions 


1. Extension de la notion de fonction. En analyse on est souvent 
amené à considérer le terme « fonction » avec un degré de généralité 
qui varie selon les questions que l’on étudie. Dans certains cas on ne 
considère que des fonctions continues, dans d’autres cas on suppose 
qu’il s’agit des fonctions dérivables une ou plusieurs fois, etc. Mais 
il y a des cas, où la notion classique de fonction, même traitée dans 
le sens le plus général, c’est-à-dire comme une loi arbitraire faisant 
correspondre à toute valeur de x appartenant au domaine de défi- 
nition de cette fonction un nombre y = f (x), se trouve insuffisante. 
En voici deux exemples importants. 

1) Ilest commode de définir la distribution des masses le long 
d’une droite à l’aide de la densité de cette distribution. Cependant, 
si sur cette droite il y a des points munis de masses positives, la den- 
sité d’une telle distribution ne peut, certainement, être décrite par 
aucune fonction « habituelle ». 

2) En appliquant les méthodes de l’analyse mathématique à 
certains problèmes, on se heurte parfois à l’impossibilité d'effectuer 
telle ou telle opération ; parexemple, une fonction n’ayant pas de déri- 
vée (en certains points ou même partout) ne peut pas être dérivée, 
si par sa dérivée on sous-entend une fonction « habituelle ». Les dif- 
ficultés de ce genre pourraient, bien sûr, être évitées, par exemple, en 
limitant l’étude aux fonctions analytiques. Mais une telle restriction 
de l’ensemble des fonctions admissibles est, dans beaucoup de 
questions, fort indésirable. 

Il se trouve pourtant que les difficultés de cette sorte peuvent être 
surmontées non au moyen d’une restriction de la notion de fonction, 
mais au moyen d’une extension considérable de cette notion, en intro- 
duisant les fonctions dites généralisées ou distributions. Les défini- 
tions correspondantes seront formulées à partir de la notion d'espace 
dual, considérée plus haut. 

Soulignons encore une fois que l'introduction des distributions 
est due à des problèmes tout à fait concrets et non à la simple tendance 
d'étendre le plus possible les notions de l’analyse. En physique, 
d’ailleurs, on a commencé à utiliser les distributions depuis assez 
longtemps, en tout cas avant qu'on ait construit la théorie mathé- 
matique rigoureuse des distributions. 
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Avant de passer aux définitions exactes, exposons l’idée prin- 
cipale de la construction. 

Soit j une fonction donnée sur la droite numérique, intégrable 
sur tout intervalle fini, et soit ç une fonction continue, nulle en dehors 
d’un certain intervalle (dans la suite les fonctions de cetie sorte se- 
ront dites à support borné). A l’aide de la fonction donnée f, à toute 
fonction @ de ce type on peut associer un nombre 


(f, g)= | f(a) pa) dz (1 


(en réalité, puisque la fonction œ (x) est à support borné, l'intégrale 
est prise sur un intervalle fini). Autrement dit, la fonction j 
peut être considérée comme une fonctionnelle (linéaire, en 
vertu des propriétés fondamentales de l’intégrale) sur un espace 
de fonctions à support borné. (Cependant, les fonctionnel- 
les de la forme (1) ne sont pas les seules que l’on puisse définir sur un 
tel espace ; en associant, par exemple, à chaque fonction œ sa valeur 
au point x = 0, nous obtiendrons une fonctionnelle linéaire qui ne 
peut pas être mise sous la forme (1). Donc, les fonctions f (x) appar- 
tiennent effectivement à un ensemble plus vaste contenant toutes 
les fonctionnelles linéaires sur un espace de fonctions à support borné. 

L'espace des fonctions @ peut être choisi de façons différentes ; 
on peut prendre, par exemple, l’espace des fonctions continues à 
support borné. Pourtant, comme on le verra plus tard, il est raison- 
nable de soumettre les fonctions admissibles @ non seulement aux 
conditions d’être continues et à support borné, mais encore à des 
conditions assez restrictives de différentiabilité. 

2. Espace des fonctions de base. Passons maintenant aux défini- 
tions exactes. Considérons sur la droite numérique l’ensemble Æ 
de toutes les fonctions à support borné @ admettant des dérivées 
continues de tout ordre. Les fonctions appartenant à À forment un 
espace vectoriel (avec les opérations habituelles d’addition des fonc- 
tions et de leur multiplication par des nombres). Dans cet espace on 
ne peut pas introduire une norme qui serait compatible avec la théo- 
rie exposée plus bas, mais on peut y introduire de façon naturelle la 
notion de convergence. 

On dit qu’une suite {w, } d'éléments de X converge versune fonction 
o € KX, si: 1) il existe un intervalle en dehors duquel toutes les fonc- 
tions @, sont nulles !); 2) la suite {@®*)} des dérivées d'ordre k ?) 
(4 — 0, 1, 2, ...) converge uniformément sur cet intervalle vers 


1) L'intervalle en dehors duquel la fonction œ est nulle peut être différent 
pour des fonctions différentes p € X. 

2) Par dérivée d'ordre 0 on sous-entend, comme d'habitude, la fonction 
elle-même. 
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). (L'uniformité de la convergence par rapport à l’ensemble des k# 
n'est pas exigée.) 

L'espace vectoriel ÆÀ avec la convergence que l’on vient de définir 
sera appelé espace de base et ses éléments seront appelés fonctions de 
base. 


On peut décrire sans difficulté la topologie de XÀ à laquelle est subordonnée 
la convergence définie dans K. Cette topologie est engendrée par la famille de 
voisinages de zéro dont chacun est défini par un ensemble fini de fonctions con- 
tinues positives Yo, « + + , Ym de Sorte qu'il est constitué par les fonctions de X 
qui vérifient pour tous les x les inégalités 


Hp (x) | Yo (@&), - .. , | PM (x) | < Ym (x). 


La vérification du fait que la convergence dans X définie plus haut, est bien 
subordonnée à cette topologie, est laissée au lecteur. 

Exercice. Désignons par X,, le sous-espace de l’espace X, formé par 
les fonctions p € K, nulles en dehors du segment [--m, ml. L'espace X,, peut être 
muni d’une structure d'espace dénombrablement normé, en posant 


Iqlin= sup |[p'(x), 2—0, 1, 2... 
O<R<n 
lx1<m 


Vérifier que la topologie (ainsi que la convergence des suites) de l’espace K,, 
engendrée par cette famille de normes, coïncide avec la topologie (respectivement, 
la convergence), induite dans X,, par la topologie (la convergence) de l’espace X, 


décrite plus haut. Il est clair que Xe KL ...c Ke... et K= |) K». 
m—1 


Montrer que l’ensemble Q & K est horné par rapport à la topologie définie sur X si 
et seulement s’il existe un nombre m tel que Q est un sous-ensemble borné de 
l’espace dénombrablement borné Kh. Soit 7 une fonctionnelle linéaire sur l’es- 
pace Æ; démontrer que les quatre conditions suivantes sont équivalentes : 
(a) la fonctionnelle T est continue par rapport à la topologie de l’espace K ; 
(b) la fonctionnelle T est bornée sur tout ensemble borné 0€ K; (c) si p, € K 
et @n — 0 (au sens de la convergence des suites, définie dans X) alors 7 (p,) — 
— 0; (d) pour chaque m la restriction T,, de la fonctionnelle 7 au sous-espace 
Km K est une fonctionnelle continue sur Xh. 


3. Distributions. 

Définition 1.0n appelle distribution ou fonction généralisée 
{donnée sur la droite — oo << x << co) toute fonctionnelle continue 
T (v) définie sur l’espace de base X. La continuité de la fonctionnelle 
doit être comprise ici en ce sens que 7 (p,) + T (+), si la suite ®, 
converge vers @ dans l’espace de base X. 

Remarquons tout d’abord que chaque fonction j (x), intégrable 
sur tout intervalle fini, engendre une distribution. En effet, l’ex- 
pression 


CO 


Ti(9= | (a) gx) (2) 


— 


est une fonctionnelle linéaire continue sur À. Dans la suite, les distri- 
butions de cette forme seront appelées distributions régulières; 
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toutes les autres, c’est-à-dire celles qu’on ne peut pas mettre sous la 
forme (2), seront dites singulières. 
Considérons quelques exemples de distributions singulières. 
1. « La fonction à »: 
T (p) = (0). 


C'est une fonctionnelle linéaire continue sur Æ, donc, conformément 
à la terminologie introduite ci-dessus, une distribution. Cette fonc- 
tionnelle s'écrit d'habitude sous la forme 


| 8) o(x) dr, (3) 


où par Ô (x) on sous-entend « la fonction », nulle pour tous les x = 0 
et infinie au point x — 0, de sorte que 


O0 
| Ô(x) dx = f. 
— 00 
Nous avons déjà considéré la fonction Ô au $ 1 comme une fonc- 
tionnelle sur l’espace des fonctions continues, définies sur un seg- 
ment. Mais en considérant la fonction Ô comme fonctionnelle sur K, 
on obtient certains avantages ; par exemple, dans ce cas on peut in- 
troduire la notion de dérivée de la fonction 6. 
2. « La fonction Ô translatée ». Soit 


T () = æ (a). 
Il est naturel d'écrire cette fonctionnelle, par analogie avec (3), 
sous la forme 


O0 


| Ô(x—a)p(x) dx. (4) 

3. « La dérivée de la fonction Ô ». A tout @ € K onfait correspon- 
dre le nombre —® (0). Un peu plus bas nous verrons pourquoi il 
est naturel de considérer cette fonctionnelle comme la dérivée de la 
fonctionnelle du premier exemple. 

4. Considérons la fonction 1/x. Elle n’est intégrable sur aucun 
intervalle contenant le point zéro. Cependant, pour chaque ® € Æ 
l'intégrale 

à 1 
TE 


existe et est finie au sens de la valeur principale. En effet, 


ÉCEAE (x) Las | PU) 0 200 7 + | PO à. 
 % b 
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Ici (a, b) est l'intervalle en dehors duquel la fonction @ s’annule. 
La première intégrale du second membre existe au sens habituel 
(comme intégrale d’une fonction continue); quant à la deuxième, 
elle existe au sens de la valeur principale. Ainsi, 1/x définit une fonc- 
tionnelle sur Æ, c’est-à-dire une distribution. On peut démontrer 
qu'aucune des distributions, considérées dans les exemples 1-4, n’est 
régulière (c’est-à-dire aucune d’elles ne peut s’écrire sous la forme 
(2), quelle que soit la fonction localement intégrable f). 

4. Opérations sur les distributions. Pour les distributions, c’est-à- 
dire pour les fonctionnelles linéaires continues sur Æ, sont définies 
les opérations d’addition et de multiplication par un nombre. En 
outre, il est évident que l’addition des distributions régulières, c’est- 
a-dire des fonctions « habituelles » sur la droite numérique, comme 
addition des distributions (c’est-à-dire des fonctionnelles linéaires), 
coïncide avec l’addition habituelle des fonctions. Il en est de même 
pour la multiplication par un nombre. 

Introduisons dans l’espace des distributions l’opération de pas- 
sage à la limite. Nous dirons qu’une suite de distributions {f,} con- 
verge vers ÿ, si pour chaque € K on a 


ns P) —+ (, ). 


Autrement dit, la convergence d’une suite de distributions est dé- 
finie comme la convergence de cette suite pour tout élément de X. 
L'espace des distributions ÆÀ avec cette convergence sera désigné 
par À*. 

Si « est une fonction indéfiniment dérivable, il est naturel de 
définir le produit de « par une distribution jf au moyen de la formule 


(af, p) = (, a) 


(l'expression qui figure au second membre de cette égalité a un sens, 
car ap € K). Toutes ces opérations, c’est-à-dire l’addition, la multi- 
plication par un nombre et la multiplication par une fonction indé- 
finiment dérivable, sont continues. 

Nous n’introduisons pas la multiplication de deux distributions. 
On peut montrer qu il est impossible de définir une telle opération, 
si l’on exige qu'elle soit continue et que dans le cas des distributions 
régulières elle coïncide avec la multiplication habituelle des fonctions 

Introduisons maintenant l’opération de dérivation des distribu- 
tions et considérons ses propriétés. 

Soit d’abord T une fonctionnelle sur Æ, définie par une fonction 
continüment dérivable }: 


O0 


T'(v)= | f(x) (x) de. 


— O0 
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Il est naturel d'appeler dérivée de 7 la fonctionnelle , définie par 
la formule 

aT tr. 

ne (P) — | f(x) (x) dx. 


En intégrant par parties et en tenant compte du fait que la fonction 
de base @ s’annule en dehors d’un intervalle fini, on obtient 


TO= | rod | (9 (: 


e e aT e « # e Lé 
ainsi, nous avons obtenu pour 7x une expression, où la dérivée de 


la fonction fn'intervient pas. Ces considérations nous don- 
nent l’idée d'adopter la définition suivante: 


Définition 2. On appelle dérivée T d’une distribution T 


la fonctionnelle, définie par la formule 


Il est clair que la fonctionnelle définie par cette formule est linéaire 
et continue, c’est-à-dire qu'elle est une distribution. De manière 
analogue on définit la dérivée seconde d’une distribution, ainsi que 
les dérivées d’ordre supérieur. 

La distribution étant désignée par le symbole f, nous allons dé- 
signer sa dérivée (au sens de la définition qui vient d’être donnée) 
par le symbole f. 

De la définition de la dérivée d’une distribution on déduit immé- 
diatement les propositions suivantes : 

1. Toute distribution admet des dérivées de tout ordre. 

2. Si une suite de distributions {f,} converge vers une distribution 
(au sens de la convergence des distributions, définie plus haut), 
la suite des dérivées {f} converge vers la dérivée jf" de la distribution li- 
mite. Îl en est de même pour les dérivées d'ordre supérieur. 

Ceci équivaut à dire que toute série convergente de distributions peut 
être dérivée terme à terme autant de fois que l’on veut. 

Considérons quelques exemples. 

1. D'après ce qu'on vient de dire, il est clair que si / est une dis- 
tribution régulière (c'est-à-dire une fonction « véritable » admettant 
une dérivée continue (ou continue par morceaux), alors sa dérivée, 
comme dérivée de distribution, coïncide avec sa dérivée au sens ha- 
bituel. 
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2. Soit 
14 pour x >0, 
= | 0 pour x<0. (9) 


Cette fonction, dile fonction de Heaviside, définit la fonctionnelle 
linéaire 


Fp= | p(x) dx. 
0 


Conformément à la définition de la dérivée d’une distribution, on a 


CO 


Gp = —( p}= — | g'(x) d2 = p (0) 
0 


(car  s’annule à l’infini). Donc, la dérivée de la fonction de Heavi- 
side (5) est la fonction 6. 

3. D’après les exemples 1 et 2, il est clair que si f est une fonction 
ayant aux points Zi, Ze, . . . des sauts respectivement égaux à A, 
h2:, - .. et dérivable (au sens habituel) dans tous les autres points, 
alors sa dérivée (comme dérivée de distribution) est égale à la somme 
de sa dérivée habituelle /” (aux points où elle existe) et d’une expres- 


sion de la forme. 
Dihiô (x — T;). 


4. En appliquant la définition de la dérivée d’une distribution à 
la fonction 6, on voit que sa dérivée est une fonctionnelle qui pour 
toute fonction de ÆÀ prend la valeur —®” (0). Or, c’est justement la 
fonctionnelle que nous avons déjà appelée « dérivée de la fonction Ô ». 

o. Considérons la série 


sin 7x 
> n (6) 
n=1 
Sa somme est une fonction périodique de période 2x définie sur le 
segment [—x, x] par les formules 


| pour 0<r<rn, 
=] It pou —r<x<o0, 
0 pour x—0. 


La dérivée de cette fonction, comme dérivée de distribution, est égale 
à 


—+tn D 6(x— 2%). (7) 


k=— — 00 
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C’est une distribution (en l’appliquant à n’importe quelle fonction 
à support borné, nous obtiendrons chaque fois seulement un nombre 
fini de termes non nuls). D’autre part, en dérivant la série (6) terme 
à terme, on obtient la série divergente suivante : 


O0 
. 
>» COS NL. 
n=1i 


Cependant, au sens de la convergence des distributions cette série 
est convergente (précisément vers l’expression (7)). Ainsi, la notion 
de distribution permet d'attribuer un sens bien déterminé à la somme 
d’une série qui, au sens habituel, est divergente. Il en est de même 
pour beaucoup d’intégrales divergentes. Cette circonstance est assez 
fréquente dans la théorie quantique des champs et dans certains au- 
tres domaines de la physique théorique. Cette situation peut, d’ail- 
leurs, se présenter même lors de la résolution de problèmes élémen- 
taires de la physique mathématique par la méthode de Fourier. Ainsi, 
par exemple, la résolution de l'équation de la corde vibrante _ — 


= ge À 
0x2 
secondes par rapport à x et à { seulement au sens de la théorie des dis- 
tributions et donc satisfaisant à cette équation aussi seulement au 
sens de cette théorie. | 
5. Suffisance de l’ensemble des fonctions de base. Nous avons 
défini les distributions comme fonctionnelles linéaires sur un espace, 
notamment sur l’espace À des fonctions indéfiniment dérivables à 
support borné. Pourtant, on aurait pu choisir l’espace de base d’une 
autre façon. Examinons les raisons qui nous ont amené à choisir À 
comme espace des fonctions de base. Ces raisons sont valables aussi 
dans d’autres cas. En imposant aux fonctions de ÆÀ les conditions res- 
trictives d’être àsupport borné et indéfiniment dérivables, nous obte- 
nons, premièrement, des distributions en grande quantité (car la 
restriction de l’espace de base entraîne, évidemment, l'élargissement 
de l’espace dual) et, deuxièmement, une plus grande liberté en ce 
qui concerne l'application aux distributions des opérations fonda- 
mentales de l’analyse (passage à la limite, dérivation). En même 
temps, l’espace des fonctions de base ÆÀ n’est pas tout à fait pauvre. 
Il contient suffisamment d'éléments pour qu’à leur aide on puisse dis- 
tinguer les fonctions continues. Plus précisément, soient f; et fo 
deux fonctions continues (et donc localement intégrables) distinctes 
sur la droite numérique. À lors il existe une fonction @ € K telle que 


conduit à des séries trigonométriques admettant de dérivées 


| AGoota) des À je(e) pe) de. (8) 
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En effet, posons f (x) — fi (x) — f2 (x). Si f (x) Æ 0, il existe un 
point x, tel que f (x0) = 0. Alors f (x) ne change pas de signe dans un 
intervalle (œ«, B) contenant le point x. Considérons la fonction 


1 
e (B-x)x-%) pour à < x 
0 pour les autres x; 
cette fonction est nulle en dehors de (œ, B) et positive à l’intérieur 
de cet intervalle; de plus, elle a des dérivées de tout ordre, si bien 


que p € K (vérifier l'existence des dérivées aux points x = « et 
x — fl). En outre, il est évident que 


we B 
| F(Hp(a)dz= | (x) p(o dr 0. 


Nous avons montré ainsi que l’espace Æ contient suffisamment d’élé- 
ments pour pouvoir distinguer deux fonctions continues quelcon- 
ques !). | 

6. Détermination d’une distribution connaissant sa dérivée. Equa- 
tions différentielles dans l’ensemble des distributions. Les équations 
différentielles constituent l’un des domaines principaux où l’on ap- 
plique la théorie des distributions. Ce sont précisément les problèmes 
liés aux équations différentielles qui ont stimulé le développement 
de cette théorie. Elle s'applique principalement aux équations aux 
dérivées partielles que nous n’étudions pas ici. Cependant, nous al- 
lons aborder ici quelques questions simples se rapportant à la résolu- 
tion des équations différentielles (ordinaires) aux distributions. 
Commençons par l'équation différentielle la plus simple 


y = f(x) 


(où f (x) est une distribution ou une fonction « habituelle »), c'est- 
à-dire par le problème de la recherche d'une distribution, lorsqu'on 
connaît sa dérivée. Considérons tout d’abord le cas f (x) = 0. 


Théorème 1. Les seules solutions (dans l'ensemble des distri- 
butions) de l'équation 
y —0 (9) 
sont les constantes. 
Démonstration. L'équation (9) signifie que 
(y', p) = (y, —p) = 0 (10) 


pour toute fonction de base € Æ. Considérons l’ensemble KX® 
des fonctions de base dont chacune peut être représentée comme la 


1) Ce résultat peut être étendu à des fonctions essentiellement plus généra- 
les que les fonctions continues, mais pour cela on a besoin de la notion d’'inté- 
grale de Lebesgue qui sera étudiée dans le chapitre suivant. 
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dérivée d’une fonction de base. Il est évident que À‘ est un sous-es- 
pace vectoriel de X. Posons œ\ (x) = —®" (x); la fonction , par- 
court À%, lorsque œ parcourt Æ. L'égalité (10) définit une fonction- 
nelle y sur K®, 

Remarquons maintenant que la fonction de base @ appartient à 
K'® si et seulement si 


[ (zx) dx —0, (11} 


ce qui signifie que À est le noyau de la fonctionnelle | @ (x) dx. 


En effet, si @ (x) = %” (x), alors 
| p (x) dx = (x) [x — 0. (12) 


Inversement, l'expression 
va= | pt (13) 


est une fonction indéfiniment dérivable. Si la condition (11) est 
remplie, 4 (x) est une fonction à support borné. Sa dérivée est égale 
à (x). En conformité avec les résultats du n° 6, $ 1, chap. IIT, toute 
fonction de base @ € K peut s’écrire sous la forme 


P=M+cPo (EAP), 


où p, est une fonction de base fixée n’appartenant pas à À et véri- 
fiant la condition 


[ Po (x) dx = 1. 


Pour cela il suffit de poser 
c= [ptdr et mr)=p(a)—cp (a). 
Ainsi, si l’on donne la valeur de la fonctionnelle y pour la fonction de 


base po (x), cette fonctionnelle se trouve définie univoquement sur 
l’espace À tout entier. En posant (y, os) — «, on obtient 


OO 


GP = Qu pi+e(n n)=a | pia)dr= | ap(x) de, 


— 00 
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c'est-à-dire la distribution y n’est autre que la constante &, ce qu'il 
fallait démontrer. 


Il en résulte que si pour deux distributions f et g on a l'égalité 
f" = g”, alors f — g — const. 
Considérons maintenant l'équation 
y = f(x), (14) 


où f (x) est une distribution arbitraire. 


Théorème 2. Pour chaque f € K* l'équation (14) a une solu- 
tion appartenant à K*. 

Il est naturel d'appeler cette solution primitive de la distribu- 
tion f. 

Démonstration. L’équation (14) signifie que 

(y”, ) — (y, —p") — (7, (0) (19) 

pour toute fonction de base ® € Æ. Cette égalité définit la valeur de 
la fonctionnelle y pour toutes les fonctions p, € K: 


X 


G pD=(r — | (648). 


— C0 


Utilisons maintenant la représentation 


P — Pi + CPo 


des éléments de À, obtenue plus haut. En posant (y, ®o) — 0, nous 
définirons la fonctionnelle y sur l’espace X tout entier: 


@ p)= Gp = (7, qu(E) dé). 


On vérifie sans peine que cette fonctionnelle est linéaire et continue. 
Elle vérifie, en outre, l’équation (14). En effet, pour chaque vo € K 
on à 
X 
= —p)=(f | p'(È)dE)=(f, @). 


— O0 


Ainsi, pour chaque distribution f (x) il existe une solution de l’équa- 


tion 
y — (x), 
c'est-à-dire chaque distribution a une primitive. D’après le théorè- 


me 1, cette primitive est définie par la fonction f (x) de façon unique 
à un terme constant près. 
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Les résultats obtenus s'étendent facilement aux systèmes d’équa- 
tions différentielles linéaires. Nous nous bornons ici aux énoncés 
Correspondants, sans donner des démonstrations. 

Considérons un système homogène de nr équations différentielles 


% 


linéaires à n distributions inconnues 
n 
= 2 air (x) Yr, i—1,2, ...,n, (16) 


où a;, sont des fonctions indéfiniment dérivables. Un tel système 
a une certaine quantité de solutions « classiques » (c’est-à-dire des 
solutions exprimées par des fonctions « habituelles », en outre, indé- 
finiment dérivables). On peut montrer que le système (16) n’a pas 
d’autres solutions dans l’ensemble des distributions. 

Dans le cas d’un système non homogène de la forme 


= 2 GinYÿr + fi (17) 


où /; sont des distributions et a;, sont des fonctions habituelles indé- 
finiment dérivables, il existe dans l’ensemble des distributions une 
solution définie à une solution arbitraire du système homogène (16) 
près. 

Si dans le système (17) non seulement a;,, mais f; aussi, sont des 
fonctions « habituelles », il se trouve que toutes les solutions de ce 
système qui existent dans X* sont aussi des fonctions habituelles. 

7. Quelques généralisations. Plus haut nous avons considéré 
des distributions « d’une variable réelle », c’est-à-dire des distri- 
butions sur la droite numérique. En partant des mêmes idées, on 
peut introduire des distributions sur un ensemble borné, par exemple, 
sur un segment ou sur une circonférence, des distributions de plusieurs 
variables, des distributions d’une variable complexe, etc. Enfin, 
même pour les distributions sur la droite numérique la définition 
qui a été donnée plus haut est loin d’être la seule possible. Considé- 
rons en bref quelques-uns des types de distributions énumérés ci- 
dessus. 

a) Distributions de plusieurs variables. Considérons dans l’espace 
à n dimensions R” l’ensemble À” des fonctions @ (x1, 2, .- . ., Æn) 
ayant des dérivées partielles de tous les ordres par rapport à toutes 
les variables et telles que chacune d'elles soit nulle en dehors d’un 
parallélépipède 


a; Lx; KL b:;, i — À, 2, ..) De 
L'ensemble K” constitue un espace vectoriel (avec les opérations habi- 


tuelles d’addition de fonctions et de leur multiplication par un nom- 
bre), dans lequel on peut introduire la notion de convergence de la 
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manière suivante : @, —> , s’il existe un parallélépipède a; < xt; < 
<b;,i—1,2,..., n, en dehors duquel chacune des fonctions ®x 
est nulle et dans lequel on a la convergence uniforme : 


n 
or gr 
TT, 07 (Du=r) 
01%1,... 0197 011... 0rû" rar 


pour chaque système donné d’entiers non négatifs @, . . ., @n. 

On appelle distribution de n variables toute fonctionnelle linéaire 
continue sur À”. Toute fonction « habituelle » de n variables f (x), 
intécerable dans tout domaine borné de R”, est en même temps une 
distribution. Les valeurs de la fonctionnelle qui lui correspond sont 
données par la formule 


(f, œ) — ff (x) o (x) dx (x = (x, . .., x,), dx — dx, ... dx»). 


De même que dans le cas n — 1, deux fonctions continues distinctes 
définissent deux fonctionnelles distinctes (c’est-à-dire constituent 
deux distributions distinctes). 

Pour les distributions de nr variables les notions de passage à la 
limite, de dérivée, etc., s’introduisent par les mêmes méthodes que 
dans le cas d’une seule variable. Par exemple, les dérivées partielles 
d'une distribution sont définies par la formule 


Ga 6) = (1) D) 


œ1 an ? 1 œn 
Ôx: e. + 0x} . + + Oz} 


On voit par là que chaque distribution de n variables admet des déri- 
vées partielles de tout ordre. 

b) Distributions complexes. Prenons maintenant pour fonctions 
de base les fonctions à support borné indéfiniment dérivables sur la 
droite numérique qui prennent des valeurs complexes. Les fonctionnel- 


les linéaires sur l’espace X de ces fonctions s'appellent distributions 
complexes. Rappelons que dans un espace vectoriel complexe il y a 
des fonctionnelles linéaires et des fonctionnelles linéaires conjuguées. 
Les premières vérifient la condition 


(, ap) = a (f, y) 
(où « est un nombre), tandis que les secondes vérifient la condition : 
(f, ap) — (F, œ). 


Si j (x) est une fonction habituelle à valeurs complexes sur la droite 


numérique, on peut lui associer une fonctionnelle linéaire sur 
de deux façons 


(f, Ph = | f(x)p(x) dx (18:) 


14—0167 
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O0 


G pe= | FD px) dx. (18) 
A la même fonction f (x) on peut associer également deux fonctionnel- 
les linéaires conjuguées, à savoir 


O0 


(4, p= | f()v 0 dx (183) 
et L 
1, p= | Top dr. (18,) 


Le choix de chacune de ces quatre possibilités correspond à une façon 
bien déterminée de plonger l’espace des fonctions « habituelles » 
dans l’espace des distributions. Les opérations sur les distributions 
complexes peuvent être définies par des procédés analogues à ceux 
qu'on a utilisés plus haut pour les distributions réelles. 

c) Distributions sur la circonférence. Parfois il est utile d'envisager 
des distributions définies sur un ensemble borné. L’un des plus sim- 
ples exemples est obtenu, en considérant les distributions sur une 
circonférence. Prenons pour espace des fonctions de base l’ensemble 
des fonctions indéfiniment dérivables sur une circonférence avec les 
opérations habituelles donnant la somme de deux fonctions et le 
produit d’une fonction par un nombre. Nous dirons qu’une suite 
{p, (x)} de fonctions de cet espace est convergente, si pour chaque 
k — 0,1,2,...,la suite des dérivées {p{4 (x)} est uniformément 
convergente sur Loute la circonférence. Comme maintenant l’ensem- 
ble des valeurs de la variable (la circonférence) est borné, il n’est 
plus question d’exiger que les fonctions soient à support borné. Les 
fonctionnelles linéaires sur cet espace de base s'appellent distributions 
sur la circonférence. 

Toute fonction habituelle sur la circonférence peut être considé- 
rée comme une fonction périodique définie sur la droite numérique. 
La même considération, appliquée aux distributions, permet de lier 
les distributions sur la circonférence aux distributions périodiques. 
On appelle distribution périodique (de période a) toute fonctionnelle 
qui vérifie la condition 

( (x), p(& — a)) = (x), p (x)) 
pour toute fonction de base @. Un exemple de distribulion périodique 
est fourni par la fonction 


O0 { OO 
» COSNT= —5 + > ÔO(xz—2kn), 
n—=1 R= — co 


qui a été déjà citée plus haut. 
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d) Autres espaces de base. Nous avons appelé plus haut distributions 
sur la droite numérique les fonctionnelles linéaires sur l’espace K 
des fonctions indéfiniment dérivables à support borné. Cependant, 
un tel choix de l’espace de base n’est pas le seul possible. Par exem- 
ple, au lieu de l’espace des fonctions à support borné Æ on pourrait 
prendre l’espace plus large des fonctions indéfiniment dérivables 
@ (x) sur la droite numérique qui décroissent, en même temps que 
leurs dérivées, plus rapidement que n'importe quelle puissance de 
EL Plus précisément, une fonction (x) est considérée comme appar- 


tenant à l’espace de base, que nous désignerons par S+, si pour tout 


couple de valeurs données de p, g = 0, 1, 2, . .. il existe une cons- 
tante C»,a (dépendant de p, q et œ) telle que 
[tp (x) | <'Cp,g —00 <Lr< oo. (19) 


La convergence dans S. est définie de la manière suivante : on dit 
qu'une suite {p, (x)} converge vers (x), si pour chaque q = 0,1, ... 
la suite {p(® (x)} converge uniformément sur tout intervalle fini 
et si dans les inégalités 


[tp (x) | C3, à 


les constantes C4 peuvent être choisies indépendantes de n. 
Dans ce cas l’ensemble des distributions est un peu moins riche 
que dans le cas de l’espace X. Par exemple, la fonction 


f(x) = 6 


est une fonctionnelle linéaire continue sur X et ne l’est pas sur Sa. 
Le choix de S. en qualité d’espace de base est commode, par exemple, 
pour l'étude de la transformation de Fourier des distributions. 

En général, comme l’a montré le développement de la théorie 
des distributions, il n’est pas nécessaire de choisir une fois pour tou- 
tes l’espace de base; juste au contraire, il y a intérêt à faire varier 
cet espace selon l’ensemble des problèmes que l’on se pose. Tout de 
même, il importe que la condition suivante soit respectée: d’uné 
part, il doit y avoir « suffisamment » de fonctions de base (pour qu’on 
puisse à leur aide distinguer les fonctions « habituelles » ou, plus 
précisément, les fonctionnelles régulières) et d'autre part, il faut 
que ces fonctions possèdent des dérivées d’ordre suffisamment grand. 


Exercice. Vérifier que l’espace S, peut être muni d’une structure 
d'espace dénombrablement normé, en posant par exemple 


Hlln= D sup [(A+Izxli)po (x), 
0<J7<gq 
et que toute suite convergente dans S- au sens de la définition donnée plus haut, 
est convergente aussi au sens de la topologie définie par ces normes. 


14% 
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$ 9. Opérateurs linéaires 


1. Définition et exemples d’opérateurs linéaires. Soient Æ£ et £E,; 
deux espaces vectoriels topologiques. On appelle opérateur linéaire 
de Æ dans £, une application 


qui vérifie la condition 
À (ax, + Pre) = a Ar + FAX. 


L'ensemble D , de tous les x € E pour lesquels l’application À est 
définie s'appelle domaine de définition de l'opérateur À ; en général, 
il n’est pas supposé que D, = E, mais nous allons toujours supposer 
que D, est une variété linéaire, c'est-à-dire que si x, y ED,,ona 
aussi ax + By € DA, quels que soient «, $. 

L'opérateur À s’appelle continu au point xo € DA, si pour tout 
voisinage V du point yo — At, il existe un voisinage U du point x 
tel que Az € V, dès que x E U fN D,. L'opérateur À est dit continu, 
s’il est continu en tout point x € D,. 

Lorsque £ et F, sont des espaces normés, cette définition est équi- 
valente à la suivante : l’opérateur À est continu, si pour tout & > 0 
il existe Ô > O0 tel que l'inégalité 


zx —2 I <8 (x, x E Da) 
implique 
| Az" — Ax" [| << &. 


La notion de fonctionnelle linéaire, introduite au début de ce 
chapitre, est un cas particulier de celle d’opérateur linéaire. Plus 
précisément, une fonctionnelle linéaire est un opérateur linéaire 
qui envoie l’espace donné £ dans la droite numérique R!. En posant 
E, = R' dans les définitions de la linéarité et de la continuité d’un 
opérateur, on retrouve les définitions correspondantes pour une fonc- 
tionnelle. 

Exactement de la même façon, beaucoup d’autres notions et ré- 
sultats, qui seront exposés plus bas pour les opérateurs linéaires, 
constituent des généralisations presque automatiques des résultats 
déjà exposés au $ 1 de ce chapitre pour les fonctionnelles linéaires. 

Exemples d'opérateurs linéaires. 1. Soit E 
un espace vectoriel topologique. Posons 


Az = x pour tous lessx€£E. 


Un tel opérateur qui transforme tout élement de l’espace en lui- 
même s'appelle opérateur identique. 
2. Soient E et F, deux espaces vectoriels topologiques quelconques, 
et soit 
Ox = 0 pour tous lesx£tE 
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(0 désigne ici l'élément nul de l’espace Æ;). Alors O s'appelle opéra- 
teur nul. 

3. Forme générale d'un opérateur linéaire appliquant un espace de 
dimension finie dans un espace de dimension finie. Soit À un opérateur 


linéaire appliquant l’espace à n dimensions R°" de base e4, ..., e 
dans l’espace à m dimensions R” de base f,, ..., fm- Si x est un 
vecteur quelconque de R”, on a 
n 
L —= > Lili) 
i=1 


d’où, en vertu de la linéarité de l’opérateur À, on obtient 
n 
AXx — > tiAe:. 
i=1 


Ainsi donc, l’opérateur À est défini, si l’on connaît les images par À 
des vecteurs de la base e,, . .., e,. Considérons les décompositions 
des vecteurs Àe; suivant la base f,, ..., fn. On a 

m 


Aeë; —= 2 Gif: 


Ceci montre que l’opérateur À est défini par la matrice des coeffi- 
cients || a; ||. L'image de l’espace R” dans R° est un sous-espace 
vectoriel dont la dimension est évidemment égale au rang de la ma- 
trice || a; ||, donc inférieure ou égale à n. Notons que tout opérateur 
linéaire, donné sur un espace de dimension finie, est nécessairement 
continu. 

4. Considérons un espace de Hilbert Æ et un sous-espace quelcon- 
que À, de H. Décomposons H en somme directe du sous-espace 1; 
et son supplémentaire orthogonal, c’est-à-dire mettons chaque élé- 
ment À € H sous la forme 


h=h +h; (k EH,, h:1H;), 
et posons 
Ph — h:. 


Il est naturel d'appeler cet opérateur P opérateur de projection ortho- 
gonale ou orthoprojecteur de H sur H,. On vérifie sans peine qu'il est 
linéaire et continu. 
5. Considérons dans l’espace des fonctions continues sur le seg- 
ment [a, b] l'opérateur défini par la formule 
b 


OP E SOIT: (1) 


a 


où X (s, t) est une fonction continue de deux variables bien déter- 
minée. La fonction 1 (£) est continue, quelle que soit la fonction con- 
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Linue o (s), de sorte que l'opérateur (1) applique l’espace des fonctions 
continues dans lui-même. Sa linéarité est évidente. Pour pouvoir 
parler de sa continuité, il faut indiquer préalablement la topologie 
que l’on considère sur notre espace des fonctions continues. On pro- 
pose au lecteur de démontrer la continuité de cet opérateur dans les 
cas où : a) l’on considère l’espace C la, b]l, c'est-à-dire l’espace des 
fonctions continues avec la norme || [[—max | œ (t)) ; b) l’on consi- 
b 


1/ 
dère l’espace C? La, b], c’est-à-dire pour || || — | ç° (#) dt) ?, 
a 
6. Dans le même espace des fonctions continues, considérons 


l'opérateur 
Ÿ () = po (t) p (6), 


où 4, (t) est une fonction continue donnée. La linéarilé de cet opé- 
rateur est évidente. (Démontrez sa continuité pour les normes indi- 
quées dans l'exemple précédent.) 

7. L'un des opérateurs linéaires les plus importants pour l’analyse 
est l'opérateur de dérivation. Il peut être considéré dans des espaces 
différents. 

a) Considérons l’espace des fonctions continues C [a, b] et l’opé- 


rateur 
Dj (&) = f" () 


dans cet espace. Il est évident que cet opérateur (que nous considé- 
rons comme opérateur de C la, b] dans C La, b]) n’est pas défini sur 
tout l’espace des fonctions continues, mais seulement sur la variété 
linéaire des fonctions admettant une dérivée continue. L'opérateur D 
est linéaire, mais pas continu. Cela résulte, par exemple, du fait que 
la suite 

sin nt 

n 


Pn (t) = 
converge vers O (pour la métrique de C la, b]), tandis que la suite 


Do, (t) = cos nt 
est divergente. 
b) L'opérateur de dérivation peut être considéré comme un opé- 
rateur de l’espace D, des fonctions continûment dérivables sur [a, b] 
avec la norme 


Ip Îh = max | (t) | + max | p' (6) | 


dans l’espace C La, b]. Dans ce cas, l’opérateur D est linéaire et con- 
tinu ; il applique l’espace D, tout entier sur l’espace C la, b] tout 
entier. 

c) Il n’est pas tout à fait commode de considérer l'opérateur de 
dérivation comme opérateur de D, dans C la, b], car alors, bien qu’un 
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tel opérateur soil continu et défini sur l’espace tout entier, il ne peut 
pas être toujours appliqué deux fois à la même fonction de D,. Il est 
plus commode de considérer l’opérateur de dérivation dans un espace 
encore plus étroit que D,, plus précisément, dans l’espace D, des 
fonctions indéfiniment dérivables sur le segment la, b] dont la topo- 
logie est donnée par une famille dénombrable de normes 


lplh= sup [pl 
O<R<N 


a<i<b 


L'opérateur de dérivation transforme tout cet espace en lui-même 
et, comme on le vérifie aisément, il est continu sur D. 

d) Les fonctions indéfiniment dérivables forment un ensemble 
assez étroit. La possibilité de considérer l’opérateur de dérivation 
comme opérateur dans un espace essentiellement plus large 
et en même temps comme opérateur continu est offerte par les 
distributions. Dans le paragraphe précédent nous avons déjà parlé 
de la dérivation des distributions. D’après ce qui a été dit là, il est 
clair que la dérivation est un opérateur linéaire dans l’espace des 
distributions, continu en ce sens que la convergence d'une suite de 
distributions {/, (t)} vers f (ft) implique la convergence de la suite de 
leurs dérivées vers la dérivée de la distribution f (#). 

2. Opérateurs linéaires bornés et continuité. Un opérateur linéaire 
de E dans £, est dit borné, s’il est défini partout dans £ et transforme 
tout ensemble borné en un ensemble borné. Entre la notion d’opé- 
rateur linéaire borné et celle de continuité il existe un lien étroit, 
exprimé par les propositions suivantes. 

I. Tout opérateur linéaire continu est borné. 

En effet, soit MC E un ensemble borné. Supposons que l'en- 
semble AMC E, ne soit pas borné. Alors dans £, il existe un voi- 


sinage de zéro V tel qu'aucun des ensembles AM n’est contenu dans 
V. Mais alors il existe une suite d'éléments x, € M telle qu'aucun des 


ne os 1 
éléments _ Azx, n’appartient à V. Par suite, d’une part, on a!) En + 


— 0 dans £ et, d’autre part, la suite {+4 ) ne converge pas vers Ü 


dans Æ,; ceci contredit l’hypothèse de continuité de l'opérateur À. 
IT. Si À est un opérateur linéaire borné de E dans E, et l’espace E 
satisfait au premier axiome de dénombrabilité, alors l'opérateur À est 
continu. 
En effet, lorsque À n’est pas continu, il existe un voisinage de 
zéro V dans Æ£, et un système fondamental de voisinages de zéro 
{U,} dans £, tels que pour tout nr on peut trouver un élément x, € 


€ Z U, tel que Az, é nV. La suite {x,} est bornée dans Æ (elle con- 


1) Cf. exercice 1, n°1, $ 5, chap. III. 
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verge même vers 0), tandis que la suite {Ax,} n’est pas bornée dans 
E, (parce qu’elle n’est contenue dans aucun des ensembles nV). Donc, 
si l'opérateur À n’est pas continu et l’espace Æ satisfait au premier 
axiome de dénombrabilité, alors À n’est pas borné. La proposition 
annoncée est démontrée. 

Ainsi, pour un opérateur donné sur un espace satisfaisant au pre- 
mier axiome de dénombrabilité (tels sont, en particulier, tous les es- 
paces normés ou dénombrablement normés) la propriété d'être borné 
équivaut à la continuité. 

Tous les opérateurs que nous avons considérés dans les exemples 
1-6 du numéro précédent sont continus. Comme tous les espaces con- 
sidérés dans ces exemples satisfont au premier axiome de dénombra- 
bilité, tous les opérateurs en question sont bornés. 

Si £ et EF, sont deux espaces normés, la condition pour qu’un opé- 
rateur À de Æ dans Æ, soit borné, peut être formulée ainsi : l’opéra- 
teur À est dit borné, s’il transforme toute boule en un ensemble bor- 
né. En vertu de la linéarité de À, cette condition peut être encore 
formulée comme suit : l’opérateur À est borné, s’il existe une cons- 
tante C telle que pour tout f € E 


IAfIK CHF 


Le plus petit des nombres C vérifiant cette inégalité s’appelle norme 
de l’opérateur À et se note ||4/{|. 
Théorème 1. Pour tout opérateur borné À d'un espace normé 
dans un espace normé, on a 
Az 
IAI= sup Azl=sup EL. (2) 
Lx 11<1 x#0 |T| 


Démonstration. Posons 


a—= sup || Ax||. 


I x fI<1 
En vertu de la linéarité de À, on a l'égalité 
Il Az || 


a— sup || Ax||=sup ; 
I x 1<1 x#0 [| 


Donc, quel que soit l'élément zx,ona 


Il x |] 


ou 
Az & fx |, 


d’où il résulte que 
IA llx= infC<a 
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D'autre part, pour tout € > 0 il existe un élément x, 0 tel que 


… Il Axe |] 
AE. | 
ou 
(a — e)|Ix.IKAxe ll Clxell 
De ce fait, 


a — e inf C —|[A|| 
et, comme € est arbitraire, on a 
œ <||A |]. 


Par conséquent, [|A ||—«. 

3. Somme et produit d’opérateurs. 

Définition. 1. Soient À et B deux opérateurs linéaires de 
l’espace vectoriel Æ dans l’espace Æ,. On appelle somme À + B de 
ces opérateurs l’opérateur C qui à un élément x € E fait correspondre 
l'élément 

U — Ax + Bzx € E. 
Il est défini pour tous les éléments appartenant à l’intersection D, f] 
MN D, des domaines de définition des opérateurs À et B. 

Il est aisé de vérifier que C —A +-B est un opérateur linéaire, con- 
tinu, si À et B sont continus. 

Si £ et E, sont des espaces normés et les opérateurs À et B sont. 
bornés, l’opérateur À + B est aussi borné et 


14 + B1IKINA TN TNBT. (3) 
En effet, pour tout x on a 
IA + B) x1l=|l4x + Brl<llA4zl+1BxI<(A + 1B DIN, 


d'où l’on obtient (3) 

Définition 2. Soient À et B deux opérateurs linéaires: 
À de E dans F; et B de E, dans £:. On appelle produit BA de ces opé- 
rateurs l’opérateur C qui à un élément x € E fait correspondre l’élé- 
ment 


z = B (Az) € E». 


Le domaine de définition De de l'opérateur C est constitué par les 
x E D, tels que Az ED. Il est clair que l'opérateur BA est li- 
néaire. Il est continu, lorsque À et B sont continus. 


Exercice. Démontrer que D est une variété linéaire, lorsque D, 
et DB sont des variétés linéaires. 


Si À et B sont des opérateurs bornés dans des espaces normés, 
? Le 0 r 
l'opérateur BA est aussi borné et 


BA KB 11-1A 1. (4) 
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En effet, 
IB(4zx)|IKIBN -1A4x1<1B11 14 1-1, (5) 


d’où l’on obtient (4). 

La somme et le produit de trois et d’un nombre plus grand d’opé- 
rateurs peuvent être définis successivement. Ces opérations sont as- 
sociatives. 

On appelle produit 4A d’un opérateur À par un nombre k l’opé- 
rateur qui à un élément x fait correspondre l'élément kAx. 

L'ensemble Z (Æ, Æ,) de tous les opérateurs linéaires continus, 
définis sur l’espace Æ tout entier, qui appliquent Æ dans Æ, (où E 
et Æ, sont deux espaces vectoriels Lopologiques donnés) constitue un 
espace vectoriel par rapport aux opérations d’addition et de multi- 
plication par un nombre, introduites plus haut. Si Æ et E, sont des 
espaces normés, alors Z (E, ÆE,) est aussi un espace normé (la défi- 
nition de la norme d'un opérateur étant celle donnée plus haut). 


Exercice. Soient Æ unespace normé et Æ;, un espace normé complet. 
Alors: a) l’espace normé Z (E, Ei) est complet; b) si 4, € & (E, E1) et 


DAE <Z oc, la série », A} converge vers un opérateur À € Z (E, E1) et 
= = 


k—1 
HAI=] 5 4< Y HA lt. (6) 
R=—1 R=—1 


4, Opérateur inverse, inversibilité. Soient À un opérateur de E 
dans £,, D, son domaine de définition et R, le domaine de ses va- 
leurs. 


Définition 3. L'opérateur À est dit inversible, si pour tout 
y ERA l'équation 
AT = y 
a une solution et une seule. 
Si À est inversible, à chaque y € RA on peut faire correspondre 
un élément et un seul x € D, à savoir la solution de l’équation ÀAx — 


— y. L'opérateur qui réalise cette correspondance s'appelle inverse 
de À et se note A”. 


Théorème 2. L'opérateur A”, inverse d’un opérateur li- 
néaire À, est aussi linéaire. 


Démonstration. Remarquonstout d’abord quele domaine 
des valeurs R1 de l’opérateur À, c’est-à-dire D 4-1, est une variété 
linéaire. Soient y,, y € RA. Il suffit de vérifier qu’on a l'égalité 


AT (cui + Goye) = A y + a Ayo. (7) 
Soit Az, — y et ÀAto — y2. En vertu de la iinéarité de À, on a 
À (œits + Gore) — Qiys + yo. (8) 
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D'après la définition de l’opérateur inverse, on peut écrire: 
A lyi=t, A y= Lo. 


En mullipliant ces deux égalilés respectivement par &, et &, et en les 
additionnant membre à membre, on obtient 


A y +oA lys = Gti + Got. 


D'autre part, de l’égalité (8) et de la définition de l’opérateur inverse 
il résulte que 


Ati + G2te = AT (œiy1 + oyo) ; 
en comparant celte égalité avec la précédente, on obtient 
AT (œiys + Goya) = A Ty + ao A yo. 


Théorème 3 (de Banach sur l'opérateur 
inverse). Soit À un opérateur linéaire borné qui applique biunivo- 
quement unespace de BanachE sur un espace de Banach E,. Alors l'opé- 
rateur inverse A”! est aussi borné. 


Pour la démonstration on aura besoin du lemme suivant. 


Lemme. Soit E un espace de Banach et M un ensemble partout dense 
dans E. Alors tout élément non nul y € E admet un développement en 
série 

Y=YTtryÿ2t...+Yn tr... 
3 
avec y EM et Ille EL. 


Démonstration. Nous allons construire les éléments y} 
de proche en proche. Choisissons y, de façon que 


le — y SE. (9) 


Ceci est possible, parce que l'inégalité (9) définit une boule de centre 


PA 
2 


un élément de M (car M est partout dense dans Æ). Choisissons en- 
suite y: € M de façon que |lyy — y, — y] y, de façon que 
<il 


ul 


y et de rayon à l’intérieur de laquelle il existe nécessairement 


y — Ya — Ye — ya et, plus généralement, y, de façon que 


y—yi —. y Un tel choix est toujours possible, étant 


donné que M est Dartout dense dans Æ£. D’après le choix des éléments 
Ur, On à 


n 
Ily — 2 ul 0 pour nr —+ o, 
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O0 


c.-à-d. la série >» y, Converge vers y. Evaluons les normes des 
k=1 


éléments y, : 


al Iles — y + yes JR 
yel= Îye + ya — y +y— yiIK NY — ya — yell+ 
+ — US UN, 
Enfin, 
 Yn = Yn + Yn-s + + y—-y+y—-yi— se —yni ll 
Lyme —ynll+ y gi y IE , 


Le lemme est démontré. 

Démonstration du théorème 3. Considérons 
dans l’espace Æ, l’ensemble M, des y vérifiant l'inégalité [|A -ly||[< 
< k||yI|. Tout élément de l'espace E, appartient à l’un des ensembles 


M}, de sorte que Æ, — UM. D'après le théorème de Baire (n° 3, 


$ 3, chap. IT), au moins L'un des ensembles WM,, par exemple ,, 
est dense dans une boule B. A l’intérieur de la boule B choisissons une 
couche sphérique P de centre en un point de M, ; par la couche P on 
sous-entend ici l’ensemble des points z vérifiant l'inégalité B << 
<||z — Yoll œ;, où 0 < P << @, yo € M}. 

En déplaçant la couche P de façon que son centre coïncide avec 
l’origine, on obtiendra la couche sphérique P, = {2:00 < B < 
<|| 21] < «}. 

Montrons qu'il existe un ensemble M, dense dans P,. Soit 
z2EP NA M,; alors z— y, E P, et 


AT (2 — yo) IN A2 HA yo Ka (2 + go DK 


<n(lz—vl+2lwol)=2lz-vell (1+ Hell) < 


<nliz—yol(1+<el). (410) 


L'expression n (1 + “in) ne dépend pas de z. Posons 1) 


vi [n(i+ et) 


Alors, d’après (10), z — yo € M, et du fait que M, est dense dans P 
il résulte que M, est dense dans P,. 

Considérons un élément non nul arbitraire y € E;. Il est toujours 
possible de trouver un nombre À tel que l’on ait B || Ay||  «, c'est- 


1) Les crochets [ ] désignent ici la partie entière d'un nombre. 
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à-dire Ày € Ps. Comme M, est dense dans P;, on peut construire une 
suite d'éléments y, € MY convergeant vers Ày. Alors la suite EU 


ze . . À 
convergera vers y. Il est évident que si yr EM y, on a aussi 7 Yr € M y», 
quel que soit le réel À =£ 0 ; par conséquent, M, est dense dans £, / 
/ {0} et donc dans Æ1. 
Considérons un élément non nul yEE,; d’après le lemme dé- 
montré, il admet un développement en série 


y=Yy+ys+r... +yr +... 


3 
on EM et [val < GEL. 


Considérons dans l’espace Æ la série constituée par les images ré- 
ciproques des éléments y,, c'est-à-dire par les éléments x, — A7lyz. 
Cette série converge vers un élément x, car on a l'inégalité 

— || 471 <N n 3llzl. 
Men IN Aa IRAN Age AN SL: 


eu outre, 


CO O0 1 
xls XI lSSN y > x SN y 
k=1 k=1 
En vertu de la convergence de la série > x, et de la continuité de 


n=1 
l'opérateur À, à cette série on peut appliquer terme à terme l'opé- 
rateur À. On obtient 


At = At + At +... =y+ys+... = y, 
d'où x — A”ly.En outre 
A Ty = [x IR 8N [lg Il 


et comme l'évaluation est vraie pour tout y 0, l'opérateur A7! 
est borné. 


Le théorème est démontré. 


Exercices. 1. Soient E, E; deux espaces normés ; un opérateur linéai- 
re À de Æ dans £; ayant pour domaine de définition une variété linéaire D, & 
« E, est dit fermé, si les conditions x,, € DA, x, — x, Ax, — y impliquent que 
zx E DA et Az = y. Vérifier que tout opérateur borné est fermé. 

2. Considérons le produit direct E X E, des espaces E et E, c’est-à-dire 
l'espace vectoriel normé constitué par tous les couples [x, y] tels que x €E, 
YE E1, avec la norme [[[x, y} = {| x|| + [|ylh (Il Ilet [ll sont les normes sur ÆE 
et Æ, respectivement). A l'opérateur À on peut associer l’ensemble G; — 
— { [x, yl:x E DA, y = Ax}CE X E1, appelé son graphe. Vérifier que GA est 
une variété linéaire dans £ X E4, fermée si et seulement si l'opérateur À est 
fermé. Démontrer que si E, E1 sont des espaces de Banach et l'opérateur À, défini 


sur l’espace E tout entier, est fermé, alors il est borné (théorème de Banach sur le 
graphe fermé). 
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Indication. Appliquer le théorème 3 à l'opérateur P: |x, Ax| — x, appli- 
quant GA, dans E 

8. Soient E et E; deux espaces dénombrablement normés complets. Démon- 
trer que si À est un opérateur linéaire continu qui applique biunivoquement E 
sur £1, alors son inverse À -t est aussi continu. Enoncer et démontrer le théorè- 
me du graphe fermé pour des espaces dénombrablement normés. 


Considérons l’ensemble Æ£ (ÆE, E,) des opérateurs linéaires bornés 
A qui appliquent l’espace de Banach Æ dans l’espace de Banach £.. 
C’est un espace de Banach. Soit $£ (E, E,) l’ensemble des opéra- 
teurs de cet espace qui appliquent £ sur Æ, tout entier et dont cha- 
cun admet un inverse borné. Cet ensemble est ouvert dans Z (£E, E,). 
Plus précisément, on a le théorème suivant. 


Théorème 4. Soit AE STL(E, E,), et soit AA un opé- 


rateur de £ (E, E,) tel que || AA << T : Alors l'opérateur À, + 
0 


+ AA admet un inverse  (Ao + AA)! borné, c'est-à-dire 
A —A;5+AAE ÿL (E, E;). 

Démonstration. Choisissons un élément y € FE, el con- 
sidérons l'application B de l’espace Æ dans lui-même, définie par la 
formule 


Br= A \y— AAAx. 


De la condition || AA | |[4;' |[F* il résulte que l'application B 
est contractante. Comme l’espace Æ est complet, il existe un point 
fixe unique x de l'application B : 


x=Br=A;y—AAAx, 
d’où 
Az = Àot + AAzx = y. 


Si Az’ — y, alors x’ est aussi un point fixe de l'application B, de 
sorte que x” — x. Ainsi, pour tout y € E, l'équation Ax = y à une 
solution unique dans £, c’est-à-dire l’opéraleur À admet un inverse 
A”, défini sur l’espace £, tout entier. D’après le théorème 3, l’opé- 
rateur À“! est borné, ce qu’il fallait démontrer. 


Théorème 5. Soient E un espace de Banach, Î l'opérateur 
identique dans E et À un opérateur linéaire borné, appliquant E dans 
lui-même et tel que || À || 1. Alors l'opérateur I — À admet un in- 
verse (1 — A)! borné qui peut être représenté sous la forme 


G—AYT= 2 A?. (11) 


Démonstration. L'existence de l'opérateur (7 — A)-tet 
sa propriété d’être borné résultent du théorème 4 (par ailleurs, cela 
découle aussi du raisonnement qui suit). 
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OO OO 


Comme || 4 [<< 1, on a > 4" [K > |A | oo. L'espace 
h=—0 k=—0 


E élant complet, la convergence de la série > || A* || en- 
k=—0 


O9 


traîne que la somme de la série »'4, est un opérateur linéaire borné. 
K=0 
Pour tout nr on a 


([— A) > Ar= SN AM(I— A)—1I— A"; 
k—0 k=0 


le passage à la limite pour ñ — oo, compte tenu du fait que || A+ | 
< ||A [F1 0, donne 


(I—A) > A*= D AF(I—A)=I, 
R—0 R—0 


(I—Aÿ1= 7», 4F, 
k=—0 


ce qu'il fallait démontrer. 


Exercice. Soit À un opérateur linéaire borné qui applique un espace de 
Banach £Æ sur un espace de Banach £E,. Démontrer qu'il existe nue constante 
a >> 0 telle que si B € £ (E, Er) et | À — B||< «, alors B applique E sur E; 
tout entier (Banach). 


9. Opérateurs adjoints. Considérons un opérateur linéaire continu 
y—<Azx appliquant un espace vectoriel topologique Æ£ dans un espace 
du même type Æ,. Soit g une fonctionnelle linéaire définie sur Æ;, 
c'est-à-dire g € EŸ. Appliquons la fonctionnelle g à l’élément y — 
= Ax; comme on le vérifie aisément, g (Ax) est une fonctionnelle 
linéaire continue définie sur £ ; désignons-la par f. La fonctionnelle f 
est donc un élément de l’espace ÆE*. À chaque fonctionnelle g € E* 
nous avons fait correspondre une fonctionnelle f € E*, c’est-à-dire 
nous avons obtenu un opérateur de E* dans E*. Cet opérateur s’ap- 
pelle opérateur adjoint de l’opérateur À et se note A*. 

En désignant la valeur de la fonctionnelle f pour l’élément x 
par le symbole (f, x), on obtient que (g, Ax) — (f, x) ou 


(g, Az) = (4*g, à). 


Cette égalité peut être considérée comme définition de l’opéra- 
teur adjoint. 

Exemple. Opérateur adjoint dans un espace de dimension finie. 
Soil À un opérateur appliquant l’espace réel à x dimensions R? 
dans l’espace (à m dimensions) R? et soit || a;; || la matrice de cet 
opérateur. 
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L'application y — Ax peut s’écrire sous la forme d’un système 
d'égalités 


et la fonctionnelle f (x) sous la forme 


f (x) = à fit. 
De l'égalité 


m nn 


f(x) = g(Ax) — 2 gyi= à à guiz;= À Tj 2 gidij 


on obtient f; — Dr Comme f — A*g, on en déduit que l’opé- 


rateur A* est donné par la matrice transposée de la matrice de l’opé- 
rateur À. 

Les propriétés suivantes des opérateurs adjoints résultent immé- 
diatement de la définition. 

1. L'opérateur A* est linéaire. 

2. (A + B)* — A + BY. 

3. Si k est un nombre, on a (kA)* — kA*. 

Si À est un opérateur continu de £ dans £,, alors A* est un opé- 
rateur continu de (E*, b) dans (E*, b) (vérifier cela !). Si E et F, 
sont des espaces de Banach, cette proposition peut être rendue plus 
précise de la manière suivante: 


Théorème 6. Si À est un opérateur linéaire borné appliquant 
un espace de Banach E dans un espace de Banach E,, on a 


AI = A]. 


Démonstration. En vertu des propriétés de la norme 
d'un opérateur, on a 


[(A%g, x) 1 = (eg, 4x) 1 < [lg 1-1 À Il il, 
d'où || A*g [K [|A [[-fg Il; par conséquent, 
IA IK IA 1. (12) 
Soitx CE et Ax Æ 0; posons yo — ET € E,; il est évident que 
Îl Yo = 1. D'après le corollaire du théorème de Hahn-Banach, il 
existe une fonctionnelle g telle que || g [= 1 et (g, yo) — 1, c'est-à- 


dire (g, Ax) = [[Ax ||. Des relations 
I Az [= (eg, Ax) = | (A4*g, x) | < IA*g 1-1 x IK 
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on obtient || À [| [[A* ||, d’où, grâce à l’inégalité (12), il vient que 


I AŸ = 14 ÎE 

Le théorème est démontré. 

Exercice. Soient Æ et E, deux espaces de Banach réflexifs et soit 
A E S(E, E;). Démontrer que A** — 4, 

6. Opérateurs adjoints dans un espace euclidien. Opérateurs auto- 
adjoints. Considérons le cas où À est un opérateur borné dans un es- 
pace de Hilbert A (réel ou complexe). Selon le théorème de la forme 
générale d’une fonctionnelle linéaire continue sur un espace de Hil- 
bert, l’application t qui à tout élément y € H fait correspondre la 
fonctionnelle linéaire 

(ty) (x) = (x, y) 
est un isomorphisme (ou isomorphisme conjugué, si H est complexe) 
de l’espace Æ sur l’espace dual H* tout entier. Soit A* l’opérateur 
adjoint de À. Il est clair que l’application A* — t-1A*+ est un opé- 
rateur linéaire borné dans H ; il est aisé de voir que pour tout y € H 
on à 


(4x, y) = (x, A*y). 


Comme || A*|| —|| À || et les applications t et t-! sont isomé- 
triques, on a aussi || A*|| —|| À ||. 

Tout ce qui vient d’être dit est, certainement, vrai aussi pour un 
espace euclidien de dimension finie, réel ou complexe. 

Adoptons la convention suivante. Si R est un espace euclidien 
(de dimension finie ou infinie), nous appellerons opérateur adjoint 
de l'opérateur À dans R l'opérateur Â* défini plus haut qui s'exerce 
dans le même espace À. 

Il importe de remarquer que cette définition diffère de la 
définition d’opérateur adjoint dans un espace de Banach arbitraire 
E, selon laquelle l’opérateur adjoint A* s’exerce dans l’espace dual 
E*. Parfois l’opérateur A*, pour être discerné de A*, est appelé 
opérateur adjoint hermitien. Pour ne pas encombrer la terminologie 
et les notations, nous allons écrire A* au lieu de A* et parler de l’opé- 
rateur adjoint sans toutefois oublier que dans le cas d’un espace eu- 
clidien l’opérateur adjoint doit être tou jours compris au sens 
indiqué plus haut. 

Il est clair que dans un espace euclidien R l’adjoint d’un opé- 
rateur À peut être défini comme l'opérateur qui, pour tous les x, 
y ER, vérifie l'égalité 

(Az, y) = (x, A*y). 


Comme À et A* sont maintenant des opérateurs dans le même es- 
pace, il se peut que A* — À. Dégageons une classe importante d’opé- 
rateurs dans un espace euclidien (en particulier, hilbertien). 


15—-0167 
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Définition 4. Un opérateur linéaire borné À dans un espace 
euclidien R est dit auto-adjoint si A* — À, c’est-à-dire si 


(4x, y) — (x, Ay) 


pour tous les x, y € À. 
Signalons la propriété importante suivante de l'opérateur A*, 


adjoint de À. Un sous-espace R, de l’espace euclidien À est dit inva- 
riant par rapport à l’opérateur À, si x € R, implique Ax € R,. Si le 
sous-espace R, est invariant par rapport à À, son supplémentaire ortho- 
gonal Rest invariant par rapport à A*. En effet, si y € RL, alors 
pour tous les x£€ R,ona 


(x, AŸy) — (Az, y) = 0, 


car'Ax € R,. En particulier, si À est un opérateur auto-adjoint, alors 
le supplémentaire othogonal de tout sous-espace invariant par rap- 
port à À est lui-même invariant par rapport à À. 


Exercice. Démontrer que si À et B sont deux opérateurs linéaires 
bornés dans un espace euclidien, on a les égalités suivantes : 


(GA + BB)* = aA* + BB*, 
(AB})* — B*A*, 
(A*#)* = 4, 

L* — ] 


(ZI est l’opérateur identique). 


7. Spectre d’un opérateur. Résolvante !). Il serait difficile 
d'indiquer dans la théorie des opérateurs une notion plus importante 
que celle de spectre. Introduisons cette notion d’abord pour le cas 
d’un espace de dimension finie. 

Soit À un opérateur linéaire dans l’espace à n dimensions C*. 
Un nombre À s’appelle valeur propre de l’opérateur À, si l’équation 


Ax = Àx 


admet des solutions non nulles. L'ensemble de toutes les valeurs 
propres s'appelle spectre de l’opérateur À ; toutes les autres valeurs 
de À sont dites régulières. Autrement dit, À est un point régulier, si 
l'opérateur À — ÀT est inversible. L'opérateur (4 — A7)! est alors 
définie sur l’espace C? tout entier et, comme tout opérateur dans un 
espace de dimension finie, est borné. Ainsi, dans un espace de di- 
mension finie on a deux possibilités suivantes: 

1) l'équation Az — Àx admet une solution non nulle, c’est-à- 
dire À est une valeur propre de À ; dans ce cas l’opérateur (A — A7)" 


n'existe pas; 


1) Partout, où il s'agit du spectre d’un opérateur, nous supposons que cet 
opérateur s'exerce dans un espace complexe. 
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2) l'opérateur (4 — ÀT)-! existe, est borné et défini sur l'espace 
tout entier, c’est-à-dire À est un point régulier. 

Si À est un opérateur donné dans un espace de dimension infinie £, 
il y a encore une troisième possibilité : 

3) l'opérateur (A — AZ) ! existe, c’est-à-dire l'équation Ax — 
— Àx n’a pas de solution non nulle, mais cet opérateur n’est pas dé- 
fini sur l’espace E tout entier (et, peut être, n’est pas borné). 

Introduisons la terminologie suivante. Nous dirons que le nombre: 
À est régulier pour l’opérateur À défini dans un espace de Banach 
(complexe) Æ, si l’opérateur R1 — (À —A1)"!, appelé résolvante de 
l'opérateur À, est défini sur l’espace E tout entier et, par conséquent 
(théorème 3), est borné. L'ensemble de toutes les autres valeurs de À 
s'appelle spectre de l'opérateur À. Le spectre contient toutes les va- 
leurs propres de l’opérateur À, car si (A — AT) x = 0 pour un x 0, 
alors l’opérateur (À — A7)! n'existe pas. L'ensemble des valeurs 
propres de À s’appelle spectre ponctuel. La partie restante du spectre, 
c'est-à-dire l’ensemble des À pour lesquels l’opérateur (A — A7)" 
existe, mais n’est pas défini partout dans Æ, s'appelle spectre continu. 
Ainsi, chaque valeur de À est pour l’opérateur À soit une valeur régu- 
lière, soit une valeur propre, soit un point du spectre continu. La 
possibilité d’un opérateur de posséder un spectre continu est ce qui 
rend la théorie des opérateurs dans un espace de dimension infinie 
essentiellement différente de la théorie analogue dans un espace de 
dimension finie. 

Soit À un opérateur borné dans un espace de Banach £. Si le 
point À est régulier, c’est-à-dire si l'opérateur (A — A7)! est défini 
partout dans £, et borné, alors pour & assez petit, l’opérateur (A — 
— (À +86) 7) l'est aussi défini partout dans Æ et borné (théorème 4), 
c'est-à-dire le point À + Ô est aussi régulier. Aïnsi, les points régu- 
liers forment un ensemble ouvert. Par conséquent, le spectre, c’est-à- 
dire le complémentaire de cet ensemble, est un ensemble fermé. 


Théorème 7. Si À est un opérateur linéaire borné dans un 
espace de Banach E et | À | >|] À ||, alors À est un point régulier. 


Démonstration. Puisqu'il est évident que 
A—M=—h(1—+ A), 
on à 
_ 1 1 1 .. A* 
— — LL __ — — = —— — 
Ri—(4— M) x (7 ï.) PART E 
k—0 
Pour || A|| | À | cette série est convergente et fournit un opéra- 
teur borné, défini sur l’espace £ tout entier (théorème 5). En d'autres 
mots, le spectre de l'opérateur À est contenu dans le cercle de rayon 


| À || et de centre 0. 
15* 
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Exemples. 1. Considérons dans l'espace C [a, b] un opéra- 
teur À, défini par la formule 


Az (t) = tx (t). (13) 
Alors 
(A — AD) xt) = (6 — À) x (6). 
L'opérateur (13) est inversible pour tout À, car de l'égalité 
(t— À)x(t) = 0 


il résulte que la fonction continue x ({) est identiquement nulle. 
Cependant, pour À € la, b] l'opérateur inverse, donné par la formule 


(AA) 2 (0 = 2 (0), 


n’est pas défini sur l’espace C [a, b] tout entier et n’est pas borné. 
(Démontrer cela!). Ainsi, l’opérateur (13) a pour spectre le segment 
la, b], mais les valeurs propres y manquent, c’est-à-dire il n’y a 
qu'un spectre continu. 

2. Considérons dans l’espace /, un opérateur À, défini de la ma- 
nière suivante : 


À :(Xs, Lo, + . .) —+ (0, x, Lo, . . .). (14) 


Cet opérateur n’a pas de valeurs propres. (Démontrer!). L'opérateur 
A”lest borné, mais il n’est défini dans /, que sur le sous-espace x, — 
—0, c’est-à-dire À—0 est un point duspectre de cet opérateur. 


Exercice. Le spectre de l'opérateur (14) contient-il d’autres points, 
sauf À — 0? 

Remarques. (1) Tout opérateur linéaire borné, défini sur un espace 
de Banach complexe ayant au moins un élément non nul, possède un spectre non 
vide. Il y a des opérateurs dont le spectre est formé d’un seul point (par exemple, 
l'opérateur de multiplication par un nombre). 

(2) Le théorème 7 peut être précisé de la manière suivante. Soit 


r= lim y || 4" | 


ñn — 00 


(on peut démontrer que cette limite existe pour tout opérateur borné A): aïors 
le spectre de l'opérateur À se trouve tout entier dans le cercle de rayon r et de centre 0. 
Le nombre r s’appelle rayon spectral de l'opérateur 4. 
(3) Les résolvantes R, et R;, correspondant aux points u et À, sont per- 
mutables et vérifient la relation 
Ry—Ri= (u—-dR,R, 
qui peut être facilement démontrée, en multipliant les deux membres de l’égali- 


té par 
(4 — AT) (4 — ur). 
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On en déduit que si À, est un point régulier de l’opérateur À, alors la dérivée de 
R) par rapport à À pour À = do, c’est-à-dire la limite 


: Ro+ AN Ro 
lim AR 
AR 0 
existe (au sens de la convergence en norme d’opérateur) et a pour valeur R3,. 


._ Exercice. Soit À un opérateur auto-adjoint borné dans un espace de 
Hilbert complexe H. Démontrer que son spectre est un sous-ensemble borné fer- 
mé de l'axe réel. 


$ 6. Opérateurs compacts 


1. Définition et exemples d'opérateurs compacts. À la différence 
des opérateurs linéaires dans un espace de dimension finie, pour les- 
quelsilexiste une description exhaustive, l'étude des opérateurs linéai- 
res arbitraires dans un espace de dimension infinie est un problème 
assez compliqué dont l’étendue est pratiquement impossible à imagi- 
ner. Cependant, certaines classes importantes de ces opérateurs peu- 
vent être décrites de manière assez complète. L'une des plus importan- 
tes de ces classes est constituée par les opérateurs ditscompacts. 
Ces opérateurs sont, d’une part, assez proches par leurs propriétés 
de ceux de dimension finie (c’est-à-dire des opérateurs bornés qui 
transforment un espace donné en un espace de dimension finie) et 
admettent une description assez détaillée; d’autre part, ils jouent 
un rôle important dans de nombreuses applications, et en premier 
lieu dans la théorie des équations intégrales qui fera l’objet du 
chap. IX. 

Définition 1. Un opérateur À qui applique un espace de 
Banach Æ dans lui-même (ou dans un autre espace de Banach £;) 
s’appelle opérateur compact ou complètement continu, s’il transforme 
tout ensemble borné en un ensemble précompact. 

Dans un espace normé de dimension finie tout opérateur linéai- 
re est compact, parce qu'il transforme tout ensemble borné en un 
ensemble borné, mais dans un espace de dimension finie tout ensem- 
ble borné est précompact. 

Dans un espace de dimension infinie la compacité d’un opérateur 
est une condition beaucoup plus forte que la condition d’être simple- 
ment continu (c’est-à-dire borné). Par exemple, dans un espace de 
Hilbert l'opérateur identique est continu, mais nullement compact. 
(Démontrer cela indépendamment de l’exemple 1, considéré plus bas.) 

Considérons quelques exemples. 

1. Soit JZ l’opérateur identique dans un espace de Banach £. Mon- 
trons que si Æ est de dimension infinie, l’opérateur 7 n’est pas com- 
pact. Pour cela il suffit, évidemment, de montrer que dans £ la boule 
unité (que l'opérateur Z transforme, certainement, en elle-même) 
n’est pas précompacte. Cela est, à son tour, une conséquence du lem- 
me suivant qui nous sera encore utile dans la suite. 
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Lemme 1. Soient x,, x2, . . . des vecteurs linéairement indé- 
pendants dans un espace normé E et soit E, le sous-espace de E engendré 
par les vecteurs x, . .., x,. Alors il existe une suite de vecteurs y;, 
Yo, - «+ vérifiant les conditions suivantes: 


4 
1) Yn = 1; 2) YnE En; 3) 0 (Yn: Enr) > +. 


OÙ O (Yn, En-1) désigne la distance du vecteur y, à l’ensemble £, 4, 
c'est-à-dire 


inf ||Yn—x||. 
XCEn-1 


Démonstration. En effet, comme les vecteurs x, Zo, . .. 
sont linéairement indépendants, æ, À En et p (tn, En) = & > 0. 
Soit x* un vecteur de Æ,_, tel que || x, — x*|| << 2x. Alors, puisque 
a —=p (tn, En) — p (xn — x*, Eh), le vecteur 


Un an 5" |] 


vérifie toutes les conditions 1)-3). Le vecteur y, peut être pris égal 


*“ T # Ed 
à AL Le lemme est démontré. 
1 


Grâce à ce lemme, dans la boule unité de tout espace normé de 
dimension infinie, on peut construire une suite de vecteurs {y,} telle 


que Op (Yn-1: Un) > L. Il est clair qu'une telle suite ne contient aucu- 


ne sous-suite convergente. Or, cela signifie justement que la précom- 
pacité n'a pas lieu. 

2. Soit À un opérateur linéaire continu qui transforme l’espace 
de Banach E en un sous-espace de dimension finie de Æ. Un tel opé- 
rateur est compact, car il transforme tout sous-ensemble borné 
M © E en un sous-ensemble borné d’un espace de dimension finie, 
donc en un ensemble précompact. 

En particulier, dans un espace de Hilbert l’opérateur de projec- 
tion orthogonale sur un sous-espace est compact si et seulement si 
ce sous-espace est de dimension finie. 

3. Considérons dans l’espace /, l'opérateur À défini de la manière 
suivante: si x — (ty, Zo, . « ., Tns . . .), alors 


1 1 
Az= (x, 5 Los es 97 TV ….) e (1) 


Cet opérateur est compact. En effet, comme tout ensemble borné 
dans /, est contenu dans une boule de cet espace, il suffit de démontrer 
que les images des boules sont précompactes ; en vertu de la linéarité 
de l'opérateur 4, il suffit de vérifier cela pour la boule unité. Mais 
l'opérateur (1) transforme la boule unité de /, en un ensemble de points 
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contenu dans le parallélépipède fondamental (cf. chap. II, $ 7, 
n° {). Par conséquent, cet ensemble est totalement borné, donc pré- 
compact. 

Exercice. Soit Az = (aty, d9Tos « + + Ann» + - -); à quelles conditions 


doit satisfaire la suite numérique {a,}, pour que cet opérateur soit compact 
dans L ? 


4. Dans l’espace des fonctions continues C [a, b] une classe im- 
portante d'opérateurs compacts est formée par les opérateurs qui peu- 
vent être représentés sous la forme 


b 
Ax=y(s)— | K(s, t)æ(t) dt. (2) 


Démontrons la proposition suivante: si la fonction K (s, t) est 
bornée sur le carréa£s<b,a<t<bet tous ses points de discon- 
linuilé sont situés sur un nombre fini de courbes 


— x (s), k — 1,2, ...,n, 


où , sont des fonctions continues, alors la formule (2) définit dans l'es- 
pace C La, b] un opérateur compact. 

En effet, remarquons tout d’abord que dans les conditions indi- 
quées l'intégrale (2) existe, quel que soit s € La, b] c'est-à-dire que 
la fonction y (s) est définie. Soit 

M— sup |K({s,t)| 


a<s, t<b 
et soit G l’ensemble des points (s, é) qui au moins pour une valeur 
de k — 1, 2, ..., n vérifient l’inégalité 
€ 
pr) < 7x 


La trace G (s) de cet ensemble sur chaque droite s — const est la réu- 
nion d’intervalles suivante 


CO= Ù {no <pr} : 


Soit } le complémentaire de l’ensemble G par rapport au carré a < 
<s, t < b. Comme l’ensemble F est compact et la fonction Æ (s, t) 
est continue sur F, il existe Ô = 0 tel que 


LE(S, L)—K (SP 57 


pour tous les points (s’, £"), (s”, {”) de F qui vérifient la condition 


[s —s"|+ | —1"|< 6. (3) 
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Evaluons maintenant la différence y (s') — y (s”) sous l’hypothèse 
que |s  —s”"|<Ô. On a 

b 

ut) —u(< Î IA (S, D —K(s", 01-12 (dr. 

a 
Pour évaluer l'intégrale du second membre de cette inégalité, divi- 
sons le segment d'intégration [a, b] en deux parties P et Q, où P — 
— G(s')1J) G(s”) et Q est la partie qui reste du segment [a, b]. 
En remarquant que P est une réunion d’intervalles dont la longueur 


totale est inférieure ou égale à on on obtient 


| LK(s,0—K(s", 01e (lat < Ex. 


P 
L'intégrale sur Q admet, évidemment, l'évaluation suivante : 


' 7 £ 
DIK(S DK (6°, De (dt < Ex 
Q 
Par conséquent, 
[y (s) — y (S'N< ell x I]. (4) 
L’inégalité (4) montre que la fonction y (s) est continue, c’est-à- 
dire que la formule (2) définit bien un opérateur qui applique l’es- 
pace C la, b] dans lui-même. Cette même inégalité montre encore que 
si {x (t)} est un ensemble borné dans C [a, b]l, alors l’ensemble cor- 
respondant {y (s)} est équicontinu. Enfin, si [|x|| & C, on a 
b 
lvl=sun{y(s1<sup [IK(s 91 2OId<M@—0 xl 
Ainsi donc, l'opérateur (2) transforme tout ensemble borné de 


C [a, b]l en un ensemble de fonctions uniformément borné et équi- 
continu, donc précompact. 

4a. La condition que les points de discontinuité de la fonction 
K (s, t) soient situés sur un nombre fini de courbes coupant les droi- 
tes s — const en un seul point est importante. Soit, par exemple, 


0 pour SCT, 


KG, D | 
[0 pour 5> ; 


l'opérateur (2) ayant un tel noyau sur le carré 0 < s, t < 1 et dont 
les points de discontinuité remplissent le segment s — <, O<i<, 


transforme la fonction x (f) = 1 en une fonction discontinue. 
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4b. Si l’on pose Æ (s, t) — 0 pour t < s, l’opérateur (2) prend la 
forme 


y (s)— | K(s, t)x(t)dt. (5) 


Supposons la fonction Æ (s, t) continue pour ts; alors, d’après 
les considérations de l’exemple 4, il en résulte que l’opérateur (5) 
est compact dans C [a, bl. 

Cet opérateur s'appelle opérateur du type de Volterra À). 

Remarque. Conformément à la définition d’opérateur com- 
pact, adoptée plus haut, il est possible que l’image de la boule unité 
fermée ne soit pas compacte (bien que précompacte). En effet, consi- 
dérons dans l’espace C [—1, 1] l'opérateur d'intégration 

Ja (9== | x (b) dt 
21 


d’après ce qu’on a démontré plus haut, J est un opérateur compact 
dans C'[—1, 1]. Posons 


Alors x, € CI—1, 1}, ||x,ll — 1 pour tous les n et 


0, si —1<Li<O0, 

1 | 1 
Yn (t)= J xh(t) — 7 ni, si OI<—, 
Le si L< Li. 


Il est clair que la suite {y,} converge dans C [—1, 1] vers la fonc- 
tion 

0, si —1<1<0, 
OT 4 à 0<1<1 


qui n’est image (dans l’application J/) d'aucune fonction de C [a, bl], 
puisque la fonction y(t) n’est pas continue. 

Cependant, on peut démontrer que si l’espace est réflexif (par 
exemple, hilbertien), l’image de la boule unité fermée, dans une ap- 
plication linéaire compacte, est compacte. 


1) Vito Volterra, mathématicien italien, on lui doit d'importants travaux 
portant sur l'analyse fonctionnelle et les équations intégrales. 
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Le 


2. Propriétés fondamentales des opérateurs compacts. 
Théorème 1. Si {A,} est une suite d'opérateurs compacts 


dans un espace de Banach E, convergeant en norme vers un opérateur À, 
alors l'opérateur À est aussi compact. 


Démonstration. Pour établir la compacité de l’opéra- 
teur À, il suffit de montrer que, quelle que soit la suite bornée x,, 
Los + + + Ens + - « d'éléments de Æ, de la suite {Azx, } on peut extraire 
une sous-suite convergente. 

L'opérateur À, étant compact, de la suite {A,x, } on peut extraire 
une sous-suite convergente. Soit 


1) D a 
x! (] Lo 9 es Zn. CE) (6) 


une sous-suite de {x,} telle que la suite {A,x,%} soit convergente. 
Considérons maintenant la suite {4,x,®}. A son tour, elle contient 
aussi une sous-suite convergente. Soit 


(2) (2) (2) 
T, , Lo , +. °. In 9 ee. + ee 


une suite extraite de (6) telle que la suite {A, x} soit convergente. 
Alors la suite {A,r,®} est, évidemment, aussiconvergente. En raison- 
nant de même, choisissons dans {1%} une sous-suile 
C3) (3) C3) 
T, , Lo , ss Tn , . + e 
telle que {4,1} soit convergente, etc. Considérons enfin la suite 
diagonale 


(1) (2) (A) 
LT, Lo, ..., An; 
Chacun des opérateurs À,, A», ..., À, . .. la transforme en une 


suite convergente. Montrons que l'opérateur À la transforme égale- 
ment en une suite convergente. La compacité de À s’en trouvera 
établie. Comme l’espace E est complet, il suffit de montrer que 
{Ax®} est une suite de Cauchy. On a 


| Azr”— Axm ||&|| Axt — Axr || + 
HI Arc — Asa [+ | Anxm — Az I (7) 

Soit |[x,|| LC; choisissons d’abord k de façon que || À — 4,|| < 
< Je ensuite choisissons NV tel que pour tous lsn > Netm>N 
on ait l'inégalité 

| Axa — Ana | << 
{cela est possible, étant donné que la suite {A,x%° } esi convergente). 
Dans ces conditions, de (7) on déduit que 

| Axn — Aïn | <'e 


pour tous les nr et m suffisamment grands. 
Le théorème est démontré. 
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Il est aisé de vérifier qu’une combinaison linéaire d'opérateurs 
compacts est compacte. Par conséquent, dans l’espace Z (E, E) 
de tous les opérateurs linéaires bornés, définis sur Æ, les opérateurs 
compacts forment us sous-espace vectoriel fermé. 

On se propose maintenant de vérifier, si l’ensemble des opéra- 
teurs compacts est clos par rapport à la multiplication des opéra- 
teurs. En réalité, une proposition essentiellement plus forte a lieu. 


Théorème 2. Si À est un opérateur compact et B est un opé- 
rateur borné, les opérateurs AB et BA sont compacts. 


Démonstration. Si l’ensemble M€ E est borné. l’en- 
semble BM l’est aussi. Par conséquent, l’ensemble ABM est 
précompact, ce qui signifie que l'opérateur AB est compact. 
De même, si M est borné, AM est précompact, d’où, en raison de la 
continuité de B, l’ensemble BAM est aussi précompact, ce qui si- 
gnifie que l'opérateur BA est compact. Le théorème est démontré. 

Corollaire. Dans un espace E de dimension infinie l'inverse 
d'un opérateur compact ne peut pas être borné. 

En effet, dans le cas contraire, l’opérateur identique Z — AÀ-1A 
serait compact dans Æ, ce qui est impossible (cf. exemple 1). 

Remarque. Le théorème 2 montre que les opérateurs compacts for- 
ment dans l’anneau des opérateurs bornés de Z (E, E) un idéal bilatère ?}. 

Théorème 3. L'opérateur adjoint d’un opérateur compact 
est compact. 


Démonstration. Soit À un opérateur compact dans unes- 
pace de Banach £. Montrons que l’opérateur adjoint A*, défini dans 
E*, transforme tout sous-esnsemble borné de £* en un sous-ensemble 
précompact. Etant donné que tout sous-ensemble borné d’un espace 
normé est contenu dans une boule, il suffit de montrer que A* trans- 
forme chaque boule en un ensemble précompact. En vertu de la linéa- 
rité de l’opérateur A*, il suffit de montrer que l’image A*S* de la 
boule unité fermée Sc E* est précompacte. 

Considérons les éléments de £* comme fonctions dont le domaine 
de définition n'est pas l’espace Æ tout entier, mais seulement le 
compact AS, c’est-à-dire la fermeture de l’image AS de la boule uni- 
té dans l’application À. Alors l’ensemble ® des fonctions correspon- 
dant aux fonctionnelles de S* sera uniformément borné et équicon- 
tinu. En effet, si [| ® [& 1, on a 

sup [p(x)[= supp (x)|<]olIsup|] Ax||<]fA || 
xEAS xCAS xES 
et Ip) —pR)I< plz — 2 N< He — x ll 


1) On appelle idéal (bilatère) d’un anneau R tout'sous-anneau ! de R tel 
que sia€l,re€R, alors ar EU et ra EU. 
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Par conséquent, cet ensemble ® est précompact dans l’espece 


C'IAS] (en vertu du théorème d'Arzelà). Mais l'ensemble ®, muni de 
la métrique induite par la métrique habituelle de l’espace des fonc- 


tions continues C [AS], est isométrique à l’ensemble A*S* (muni de 
la métrique engendrée par la norme de l’espace E*). En effet, si 
£1: 82 € SF, on à 


| À *g1 — A*g2 || — sup | (A*g1 — A*ge, x) |— 
xES 
— sup | (81— &), Ax)|— sup |(g1— 82, z)|= 
xES xES 


— sup | (g1— 82, z)|—P (g1, 82). 
xEAS 


Comme l’ensemble ® est précompact, il est totalement borné; par 
conséquent, son isométrique A*S%* est aussi un ensemble totalement 
borné. De ce fait, A*S* est précompact dans £. 

Le théorème est démontré. 

Remarque. On vérifie sans peine que l’ensemble ® est fermé 


dans C'(AS), de sorte qu'il est compact ; alors l’ensemble A*S* est 
aussi compact, bien que (comme le montre la remarque, page 2335) 
l’image de la boule unité fermée dans une application complètement 
continue arbitraire puisse ne pas être compacte. La situation rencon- 
trée dans le théorème que nous venons de démontrer diffère du cas 
général par le fait que la boule unité fermée S* de E* est compacte 
pour la topologie +«-faible de l’espace E* (cf. théorème 3, $ 3). C'est 
ce qui implique la compacité (pour la métrique de l’espace Æ*) de 
l’image de l’ensemble S* par tout opérateur compact. 


Exercices. 1. Soit À un opérateur linéaire borné dans un espace de 
Banach. Démontrer que si l’opérateur À * est compact, alors À est aussi compact. 

2. Pour qu’un opérateur linéaire À dans un espace de Hilbert 77 soit compact, 
il faut et il suffit que l'opérateur (hermitien) adjoint A* soit compact. 


3. Valeurs propres d’un opérateur compact. 


Théorème 4. Un opérateur compact À dans un espace de Ba- 
nach E ne peut avoir, pour chaque à >> 0, qu'un nombre fini de vecteurs 
propres linéairement indépendants, correspondant aux valeurs propres 
dont le module est plus grand que 6. 


Démonstration. Soit À4, À», ..., An, . . . une suite de 
valeurs propres de l'opérateur À (non nécessairement toutes diffé- 
rentes) telles que | À, | >> Ô; soit æ1, Zo, . . . æh, . . . la suite cor- 


respondante de vecteurs propres et supposons que ces vecteurs soient 
linéairement indépendants. 
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Usons du lemme 1 (page 230) et construisons une suite de vecteurs 
Yas Yo + + +» Uns + - . telle que 


1) Yn € En; 2) Un = 1; 
1 
3) P(Uns En1)= inf yn—2|>+ , 
XCEn-1 


où £, désigne le sous-espace engendré par les vecteurs x, Zo, - . ., Zn. 
En vertu de l'inégalité | À, | > Ô, la suite {2 }est bornée. Mon- 
nm 
trons que la suite des images {A(E)) ne contient aucune sous- 
7 ñn 
suite convergente. En effet, soil y, — D antr ; alors 
k—1 


n—1 


CA 
À (2) — D ru Th Enln = Yn-Ÿ Zn: 
n 
k=-1 


n—=1 
À 
2n= Ÿ (0,75 (— 1) Xh € En-1- 
k=—1 


Donc, pour tous les p et q, tels que p=>g.ona 
Yp \_ A (Va | = _ _ 
LA (72) A (52) Up +22 — (Ya +-29) || 


1 
— || Yp — (Ya +29 — 2) | > 5: 


Car ya + Zqa — Zp € E 4. 

Or, ceci contredit l'hypothèse que l'opérateur À est compact. 

Du théorème démontré on déduit, en particulier, que le nombre de 
vecteurs propres linéairement indépendants, correspondant à une 
valeur propre donnée À, = 0 d’un opérateur compact À, ne peut être 
que fini. 

De ce théorème il résulte encore que le nombre de valeurs propres 
À, d'un opérateur compact À, appartenant à l'extérieur du disque 
|A | >> Ô > 0, est toujours fini et que l’ensemble de toutes les va- 
leurs propres de l'opérateur À peut être rangé dans l’ordre de non- 
croissance de leurs modules: [LA | > |k|>... 

4. Opérateurs compacts dans un espace de Hilbert. Plus haut nous 
avons parlé des opérateurs compacts dans un espace de Banach arbi- 
traire. Complétons maintenant les renseignements oblenus par quel- 
ques nouveaux faits se rapportant aux opérateurs compacts dans un 
espace de Hilbert. 

Nous avons dit qu’un opérateur À est compact, s’il transforme 
tout ensemble borné en un ensemble précompact. Comme H — H*, 
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c'est-à-dire 7 est le dual d’un espace séparable, tous les ensembles 
bornés de Æ (et ceux-là seulement) sont faiblement précompacts. 
Par conséquent, dans un espace de Hilbert on peut appeler opérateur 
compact tout opérateur qui transforme tout ensemble faiblement pré- 
compact en un ensemble précompact pour la topologie forte. 

Enfin, dans certains cas il est commode d'adopter la définition 
suivante de la compacité d’un opérateur dans un espace de Hilbert : 
un opérateur À est dit compact dans FH, s’il transforme toute suite 
faiblement convergente en une suite fortement convergente. En effet, 
supposons cette dernière condition remplie et soit M un ensemble 
borné dans A. Tout sous-ensemble infini de M contient une suitefai- 
blement convergente. Si l'opérateur À transforme cette suite en une 
suite fortement convergente, l’ensemble AM est précompact. Réci- 
-proquement, soient À un opérateur compact, {x,} une suite faible- 
ment convergente et x sa limite faible. Alors {Ax, } contient une sous- 
suite fortement convergente. D'autre part, en vertu de la continuité 
de À, la suite {Ax,} converge faiblement vers Ax, ce qui implique 
que {Azx,} ne peut pas avoir plus d’un point d’accumulation. Par 
conséquent, {Ax,} est une suite convergente. 

9. Opérateurs compacts auto-adjoints dans Z. Pour les opérateurs 
linéaires auto-adjoints dans un espace euclidien de dimension finie 
on a le théorème bien connu sur la possibilité de réduire la matrice 
d’un tel opérateur à la forme diagonale par le choix d’une base ortho- 
normée convenable. Dans ce numéro nous étendrons ce théorème aux 
opérateurs compacts auto-adjoints dans un espace de Hilbert. Les 
résultats de ce numéro sont valables aussi bien pour un espace de Hil- 
bert réel que pour un espace de Hilbert complexe. Pour fixer les 
idées, nous supposerons À complexe. 

Etablissons tout d’abord quelques propriétés des vecteurs et des 
valeurs propres des opérateurs auto-adjoints dans Z7, tout à fait ana- 
logues, d’ailleurs, aux propriétés correspondantes des opérateurs auto- 
adjoints dans un espace de dimension finie. 

I. Toutes les valeurs propres d'un opérateur auto-adjoint À dans H 
sont réelles. 

En effet, soit Az = x, || x | 0; alors 


à (x, x) = (Az, x) = (x, Az) = (x, hx)= À (x, à), 
d'où À = À. 
II. Les vecteurs propres d'un opérateur auto-adjoint dans H, as- 


sociés à des valeurs propres distinctes, sont orthogonaux. 
En effet, si Az = x, ÀAy = uyetÀÆuona 


À (x, y) = (Az, y) = (x, Ày) = (à, uy) = u (x, y), 


d’où (x, y) = (. 
Démontrons maintenant le théorème fondamental suivant. 
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Théorème 5 (de Hilbert-Schmidt). Pour tout 
opérateur linéaire compact auto-adjoint À dans un espace de Hilbert H 
il existe un système orthonormé {p,} de vecteurs propres, associés aux 
valeurs propres non nulles {},}, tel que tout élément & € H peut s'écrire 
de manière unique sous. la forme 


E— Dicnga+E", 
où &’ E Ker À, c’est-à-dire AË’ = 0; en outre, 
AË= D Ana Pr 


et si le système {®p, } est infini, on a 
lim À —=0. 


NN — 00 


Pour la démonstration de ce théorème nous aurons besoin des pro- 
positions auxiliaires suivantes. 

Lemme 2. Si la suite {E,} converge faiblement vers & et l’opé- 
rateur linéaire À est compact, on a 


Démonstration. Pour tout nr on a 


| (AËns Ën) — (46, OI 
| (AËn, En) — (AË, En) | + | (AË, &1) — (AË, EË) |. 
Mais 
| (AËn, En) — (A6, En) | < En IA (En — 6) | 


et 
| (AË», €) — (AE, ED] —1I(E6, À (En — EI < 
< || 8 1-1 AÀ (na — Ë)11; 


comme les nombres || &, || forment un ensemble borné et || À (&, — 
— £)||— 0, on en déduit que 


| (AËn, En) — (46, Ë) 1 — 0, 
ce qu’il fallait démontrer. 
Lemme 3. Si la fonctionnelle 
|Q (Œ) 1 = | (46, €) |, 


où À est un opérateur linéaire auto-adjoint borné, atteint son maximum 
sur la boule unité au point &o, alors 


(Eos n) — 0 
(460, n) = (6o, An) = 0. 


implique 
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Démonstration. Il est évident que || £o ||— 1. Posons 
E — £o + an 
VT+Ta En Il 
où a est un nombre complexe arbitraire. Alors || £0 [|—1 implique que 
IE 11=1. 


D'autre part, on a 
CO = re (0 (0) a (AE, n) 4e (AE, ma Q (I. 


Le nombre a peut être choisi de module arbitrairement petit et de 


façon que a (AË», n) soit un nombre réel. Alors a (AË,, 1) —a(AË5, 1) 
el on à 


Q (E) = Q (Ëo) + 2a (AËo n) + O (la F). 
Si (469, 1) 0, il existe a tel que 
[Q (8 1> 10 (60) | 


ce qui contredit l'hypothèse du lemme. 

Du lemme 3 on déduit immédiatement que si | Q (£) | atteint son 
maximum pour ë = Ë,, alors £, est un vecteur propre de l’opéra- 
teur À. 

Démonstration du théorème o. Construisons les 
éléments 4, par récurrence, dans l’ordre de décroissance des valeurs 
absolues des valeurs propres correspondantes : 


IMIZzIMIZ... 21h12... 


Pour construire l’élément ®;, considérons l'expression | Q (€) | = 
— | (AË, Ë) | et démontrons qu'elle atteint sur la boule unité son 
maximum. Soit &1, 6», . . . une suite, telle que || &,|| = 1 et 


|(AË, E,) | — S lorsque n —+ oo, 


S— sup |(AË, Ë)|: 
TETE 


Supposons que $ >> 0. Etant donné que dans Æ la boule unité est 
faiblement compacte, de la suite {£,} on peut extraire une sous-suite 
convergeant faiblement vers un élément n. En outre, || n|| < 1 et 
selor. le lemme 2 on a 


(An, n)1= 5. 


C’est cet élément n que nous prendrons pour ,. [l est clair que || n || 
vaut exactement 1. (En eïffet, supposons || n [I 1 et posons n, — 
n 


— ji? alors {|| 11 [= 1 et | (Am, ni) | >> S, ce qui est en contra- 
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diction avec la définition de S.) En outre, 
Ami = Mi, 
d’où 


MICORIE __ 
[A |= (Di, D) —|(4p:, p1)|=S. 


Supposons maintenant que les vecteurs propres 


Pis Pas + + + Pro 
associés aux valeurs propres 


À, Âos oo Àn: 


soient déjà construits. Désignons par M (1, Do, .- . ., Pr) le sous- 
espace engendré par les vecteurs ®@1, ®@o, . . ., @n. Considérons la 
fonctionnelle 

| (AË, Ë) |, 


définie sur l’ensemble des éléments appartenant à l’ensemble 
Mi— HOM (1, OL .…, On) 


(c’est-à-dire orthogonaux à @1, 2, . . ., @n) et vérifiant la condition 
| 81 1. L'ensemble W:l est un sous-espace invariant par rapport à 
A (car l’espace M (m1, Do, . . ., ®,) est invariant et l'opérateur À 
est auto-adjoint). En appliquant à M} les mêmes raisonnements que 
plus haut, nous arrivons à la conclusion que dans M1 il existe un vec- 
teur propre de l’opérateur À (désignons-le par ®h41). 

Deux cas peuvent se présenter : 1) il existe un entier naturel # 
tel que dans le sous-espace M1 on a (AË, Ë) = 0; 2) (AË, Ë) 0 


sur ML quel que soit n. 
Dans le premier cas, d’après le lemme 3, l'opérateur À transfor- 


me M5 en {0}, de sorte que le sous-espace M est composé tout en- 
tier des vecteurs propres, correspondant à À — 0. Le système des 
vecteurs propres construits {p,} contient un nombre fini d'éléments. 
Dans le deuxième cas on obtient une suite infinie de vecteurs pro- 
pres {p,} dont chacun correspond à une valeur propre À, = 0. Mon- 
trons que À, —+ 0. La suite {p,} (comme toute suite orthonormée) 
converge faiblement vers 0 ; c’est pourquoi la suite d'éléments Ap, — 
— À»®n Converge vers zéro en norme, d'Où | À | —|| A@n || — 0. 
Soil 


MT=HOM (Qu Dos ce. Pr ce.) = n Mi 0. 


Sié € ML et ë O0, alors (AË, Ë) < À, 6 |? pour tous les n, c’est- 
à-dire 


(AË, Ë) = 0. 


16—0167 
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En vertu du lemme 3 (pour max | (AË, Ë) | — 0), appliqué à Mi, 
on obtient que AË = 0, ce qui signifie que l'opérateur À transforme 
M+ en {0}. 

D'après la construction du système {o, } il est clair que tout vec- 
teur peut être mis sous la forme 


E — Dénpn + E’, où AE’ = 0, 


d’où il résulte que 
AË = D'nCPn- 


Le théorème est démontré. 

Ce théorème joue un rôle important dans la théorie des équations 
intégrales dont il sera question au chap. IX. 

Remarque. Le théorème démontré signifie que pour tout 
opérateur auto-adjoint compact À dans }Æ il existe une base ortho- 
gonale de l’espace A, composée des vecteurs propres de cet opéra- 
teur. En effet, pour obtenir une telle base, il suffit de compléter le 
système des vecteurs propres {p,}, construit dans la démonstration 
du théorème, par une base orthogonale arbitraire du sous-espace M+ 
que l’opérateur À transforme en {0}. En d’autres termes, le résultat 
obtenu ici est tout à fait analogue au théorème sur la réduction de la 
matrice d’un opérateur auto-adjoint dans un espace euclidien de di- 
mension finie à la forme diagonale dans une base orthogonale. 

Pour les opérateurs dans un espace à nr dimensions qui ne sont pas 
auto-adjoints une telle réduction est, en général, impossible, mais 
on a toutefois le théorème suivant : dans un espace de dimension n toute 
application linéaire admet au moins un vecteur propre. On vérifie sans 
peine que cette assertion ne s'étend pas aux opérateurs compacts dans 
H. En effet, soit À un opérateur défini dans /, par la formule 


To LTn— 
At = A(xi, Lo, ..., TL .….)=(0, Li D os à .….) 0) 


Cet opérateur est compact (vérifier !), mais n’a aucun vecteur propre 
(démontrez cela). 


Exercice. Déterminer le spectre de l'opérateur (8). 


CHAPITRE V 


Mesure, fonctions mesurables, 
intégrale 


La notion de mesure u (4) d’un ensemble À est une généralisation 
naturelle des notions suivantes : 

1) longueur / (A) d’un segment A, 

2) aire S (7) d’une figure plane F, 

3) volume V (G) d’un corps G. 

4) accroissement œ (b) — œ (a) d’une fonction non décroissante 
œ (£) sur un intervalle semi-ouvert [a, b), 

o) intégrale d’une fonction non négative, prise sur un domaine 
de la droite numérique, du plan ou de l’espace, etc. 

Cette notion apparut pour la première fois dans la théorie des 
fonctions d’une variable réelle et se naturalisa ensuite dans la théorie 
des probabilités, dans la théorie des systèmes dynamiques, dans l’ana- 
lyse fonctionnelle et dans beaucoup d’autres domaines des matéma- 
tiques. 

Dans le $ 1 de ce chapitre nous exposerons la théorie de la mesure 
pour des ensembles du plan. en partant de la notion d’aire du rec- 
tangle. La théorie générale de la mesure sera exposée dans les $$ 2 
et 3. Le lecteur remarquera facilement que tous les raisonnements du 
$ 1 ont un caractère général et se répètent dans la théorie abstraite 
sans modifications importantes. 


$ 1. Mesure des ensembles du plan 


1. Mesure des ensembles élémentaires. Considérons une famille © 
d’ensembles du plan (x, y) dont chacun est défini par une inégalité 


de la forme 
ax b, 
ax b, 
a Lx b, 
a<<x< bd 

et une inégalité de la forme 
cCLYy<d, 
C<Ly< d, 
CKy<d, 
cC<Ly<d, 

16? 


244 MESURE, FONCTIONS MESURABLES, INTÉGRALE [Ch. V 


où a, b, c et d sont des nombres arbitraires. Les ensembles apparte- 
nant à cette famille s'appellent rectangles. Un rectangle fermé, défini 
par les inégalités 

aLxr<Lb, cLY<d, 


représente soit un rectangle au sens habituel (avec sa frontière), si 
a <'betc << d, soit un segment de droite (si a := betc<doua< b 
et c — d), soit un point (si a — b et c — d), soit, enfin, un ensemble 
vide (si a > b ou c > d). Un rectangle ouvert 


aLr<b, c<L<y<d 


représente, suivant les relations existant entre les nombres a, b, cet d, 
un rectangle sans frontière ou un ensemble vide. Chacun des rectangles 
des types qui restent (nous les appellerons semi-ouverts) peut être 
soit un rectangle habituel sans un, deux ou trois côtés, soit un inter- 
valle ouvert ou semi-ouvert, soil, enfin, un ensemble vide. 

Désignons l’ensemble de tous les rectangles du plan par @. 

Définissons la mesure de chaque rectangle en conformité avec la 
notion élémentaire bien connue d’aire. Plus précisément : 

a) la mesure d’un ensemble vide est égale à 0; 

b) la mesure d’un rectangle non vide (fermé, ouvert ou semi- 
ouvert), défini par les nombres a, b, c et d, est égale à 


(b — a) (d — c). 


Ainsi, à tout rectangle P de © se trouve associé un nombre m (P), 
sa mesure, qui vérifie les conditions suivantes : 
1) la mesure m (P) prend des valeurs réelles non négatives ; 


n 
2) la mesure m (P) est additive, c’-à-d. si P = U P,et P; N 
k=1 
NP; = @ pour i Æ j, alors 


n 
m(P)= > m(Pi). 
k=1 
Le problème est encore d'étendre, sans violer les propriétés 1) et 2), 
la mesure m (P), définie ici pour les rectangles, à des ensembles plus 
généraux. 

Nous étendrons d’abord la notion de mesure aux ensembles dits 
élémentaires. Un ensemble de points du plan est dit élémentaire, 
s’il peut être mis au moins d’une façon sous la forme d'une réunion 
finie de rectangles deux à deux disjoints. 

Dans la suite nous aurons besoin du théorème suivant. 


Théorème 1. La réunion, l'intersection, la différence et la 
différence symétrique de deux ensembles élémentaires sont aussi des en- 
sembles élémentaires. 
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Ainsi, conformément à la terminologie introduite au $ 9, chap. Ï, 
les ensembles élémentaires forment un anneau. 

Démonstration. Il est clair que l'intersection de deux 
rectangles est un rectangle. Donc, si 


A= UP, et B=1J0; 
k j 


sont deux ensembles élémentaires, leur intersection 


ANB = ,U(Px N Q;) 


est aussi un ensemble élémentaire. 

Il est aisé de vérifier que la différence de deux rectangles est un 
ensemble élémentaire. Par conséquent, si d’un rectangle quelconque 
on soustrait un ensemble élémentaire, on obtient un ensemble élé- 
mentaire (comme intersection d’ensembles élémentaires). Soient main- 
tenant À et B deux ensembles élémentaires. Il existe, évidemment, 
un rectangle P contenant chacun d’eux. Alors, d’après ce qui pré- 
cède, l’ensemble 


AUB=PKIPNXA)N (PNB) 


set élémentaire. Ceci et les égalités 
AXB=AfN(P\B) 
et 
AAB = (AU B)X (AN B) 


impliquent que la différence et la différence symétrique de deux en- 
sembles élémentaires sont des ensembles élémentaires. 

Le théorème est démontré. 

Définissons maintenant la mesure m’ (A) d’un ensemble élémen- 
taire de la manière suivante: si 


A = UP», 
k 


où P, sont des rectangles deux à deux disjoints, alors 
m'(4)= 2m (Pa). 


Montrons que m’ (A) ne dépend pas de la façon de décomposer À 
en une réunion finie de rectangles. Soit 


À = Ù Pr = UQ; 


où P, et Q; sont des rectangles et P; AN P, — @,Q; N Q: = © pour 
i Æ k. Comme l'intersection P, N Q; de deux rectangles est un rec- 
tangle, en vertu de l’additivité de la mesure pour les rectangles, on a 


Dm (Pa) = 2m (PaNQ;) = 2m (O5). 


k, ÿ 
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En particulier, pour les rectangles la mesure m’ coïncide avec la me- 
sure initiale m. 

Il est aisé de voir que la mesure des ensembles élémentaires ainsi 
définie est non négative et additive. 

Etablissons maintenant une propriété importante de la mesure 
d'un ensemble élémentaire. 


Théorème 2. Si À est un ensemble élémentaire et {A,} est une 
jamille finie ou dénombrable d'ensembles élémentaires, telle que 


À € |) 4h, 


alors 
m "A)<2 M" (An). (1) 


Démonstration. Pour tout & >> O0 et tout ensemble élé- 
mentaire donné À il existe, évidemment, un ensemble élémentaire 


fermé À inclus dans À et vérifiant la condition 

m'(4)>m' (4) ——-. 
(11 suffit de remplacer chacun des 4 rectangles P; qui composent À 
par un rectangle fermé situé à son intérieur et ayant l’aire plus grande 
que m (P;) — SK =) 


D'autre part, pour chaque À, on peut trouver un ensemble élé- 
mentaire ouvert À, contenant À, et vérifiant la condition 


m (An) &m' (An) +5 
Il est clair que : : 
AC U An. 
De {4,} (en vertu du lemme de Heine- Borel) on peut extraire une 
famille finie An,, . .., An, recouvrant À. Il est évident que 


m' (A)< Dm (An,) 


(car sinon À se trouverait recouvert par une famille finie de rectangles 


dont l'aire totale est inférieure à m’ (A), ce qui est impossible). Par 
conséquent, 


m'(4)<m'(4)+5< 5 m' (4) +T< 
i— 1 
<Dm'()+s< Dm (An)+S at ze Dm’ (Ar)+e, 


d’où, puisque € >> 0 est arbitraire, on obtient (1). 
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La propriété de la mesure m’, établie par le théorème 2 (la mesure 
d'un ensemble est inférieure ou égale à la somme des mesures des en- 
sembles qui le recouvrent, pris en nombre fini ou dénombrable), s’ap- 
pelle sous-additivité. Elle implique la propriété dite additivité dénom- 
brable ou o-additivité qui consiste en ceci. 

Supposons que l’ensemble élémentaire À soit mis sous la forme 
d’une réunion dénombrable d’ensembles élémentaires dis - 
joints 4, (n —1,2,...): 


alors 
m'(4)= Ÿ m' (4) 


{c.-à-d. la mesure d’une réunion dénombrable d’ensembles disjoints 
est égale à la somme des mesures de ces ensembles). 
En effet, grâce à l’additivité, pour tout V on a: 


N N 
m'(4A)>m' CU 45) — à m'(An). 


En passant à la limite pour V — ©, on obtient 


OO 


m'(4)> X m' (4). 


En vertu du théorème 2, l'inégalité de sens contraire est aussi vraie. 
Ainsi, l’additivité dénombrable de la mesure m’ est démontrée. 

Remarque. Le lecteur peut se faire l'impression que l’addi- 
tivité dénombrable de la mesure sur le plan s’obtient automatique- 
ment de l’additivité de celte mesure par le passage à la limite. En réa- 
lité il n’en est pas ainsi (dans la démonstration du théorème 2, en 
utilisant le lemme de Heine-Borel, nous nous sommes basés essentiel- 
lement sur la liaison existant entre les propriétés métriques et topo- 
logiques des ensembles du plan). Au $ 2, lors de l’étude de la mesure 
sur des ensembles abstraits arbitraires, nous verrons que l’additivité 
de la mesure n’entraîne pas, en général, son additivité dénombrable. 

2. Mesure de Lebesgue sur le plan.Les ensembles élémentairesn’épui- 
sent pas tous les ensembles que l’on rencontre en géométrie et en analyse 
classique. C’est pourquoi il est naturel de chercher à étendre la notion 
de mesure, sans violer ses propriétés fondamentales, à des ensembles 
plus généraux que les réunions finies de rectangles ayant les côtés 
paralleles aux axes des coordonnées. 

Une solution, en un certain sens complète, de ce problème a été 
donnée par H. Lebesgue au début du XX siècle. 
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Pour exposer la théorie de la mesure de Lebesgue nous serons ame- 
nés à considérer non seulement des réunions finies, mais aussi des 
réunions infinies de rectangles. Pour ne pas nous heurter dès le début 
à des ensembles « de mesure infinie », bornons-nous d’abord aux en- 
sembles contenus entièrement dans le carré £ = {0<zx<1;:0< 
<y <1}. 

Sur l’ensemble de tous ces ensembles définissons une fonction 
u* (4) de la manière suivante. 

Définition 1. On appelle mesure extérieure d’un ensemble À 
le nombre 


u*(4)= inf >m(Ps), (1) 
ACUP, R 


où la borne inférieure s'étend à tous les recouvrements de l’ensemble 
A par des familles finies ou dénombrables de rectangles. 

Remarques. 1. En considérant dans la définition de la me- 
sure extérieure des recouvrements constitués non seulement de rectang- 
les, mais d’ensembles élémentaires arbitraires (pris en nombre fini 
ou dénombrable), nous obtiendrons, évidemment, la même valeur de 
u* (4), car tout ensemble élémentaire est une réunion finie de rec- 
tangles. 

2. Si À est un ensemble élémentaire, alors u* (4) — m’ (4). 
En effet, soient P,, ..., P, les rectangles composant À. Alors, par 
définition, 


m' (À) = 2 m (P;). 


Comme les rectangles P; recouvrent 4, onau* (A) D, m (P;) — 
1 


1— 
— m' (4). Mais si {Q;} est une famille finie ou dénombrable quel- 
conque de rectangles recouvrant À, d’après le théorème 2 on a 


m' (4) < 2m (Q;); par conséquent, u* — m’ (À). 
9 


Théorème 3. Si 
AC |) 4h, 


n 


où {A,} est une famille finie ou dénombrable d’ensembles, alors 
p*(4)< Ju* (An). 2) 


En particulier, si AC B, on a u* (4) < u* (B). 


Démonstration. D’après la définition de la mesure exté- 
rieure, pour chaque 4, il existe une famille finie ou dénombrable de 
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rectangles {P,,} telle que 4, € U P,r et 
R 


D m (Pr) SU (Ar) à 
R 


où & >> 0 est choisi arbitrairement. Mais alors 
AC UD Pa 
et 
u* (4)<22 m (Pnr)< 2: u* (An) +e. 


Comme & >> 0 est arbitraire, on en déduit l’affirmation du théorème. 
Puisque pour les ensembles élémentaires m’ et u* coïncident, 
le théorème 2 est un cas particulier du théorème 3. 
Définition 2. Un ensemble À est dit mesurable (au sens de 
Lebesgue) si pour tout € >> 0 il existe un ensemble élémentaire B 
tel que 


u* (4AB) < &. (3) 


La fonction u*, considérée seulement pour des ensembles mesu- 
rables, s'appelle mesure de Lebesgue. Elle sera notée par u. 

Remarque. La définition de la notion de mesurabilité, for- 
mulée plus haut, a un sens intuitif simple. Elle signifie qu’un ensem- 
ble est mesurable, s’il peut être « approché avec n'importe quelle pré- 
cision » par des ensembles élémentaires. 

Ainsi, nous avons défini une famille Nx d’'ensembles dits mesu- 
rables et sur celle famille une fonction Lu dite mesure de Lebesgue. 
Notre but immédiat est d'établir les résultats suivants: 

1. La famille M x des ensembles mesurables est close par rapport aux 
réunions et intersections finies ou dénombrables (c.-à-d. représente une 
o-algèbre, cf. définition n° 4, $ 5, chap. I). 

2. La fonction u est o-additive sur M x. 

Les théorèmes ci-dessous représentent des étapes de la démonstra- 
tion de ces assertions. 


Théorème 4. Le complémentaire d'un ensemble mesurable 
est un ensemble mesurable. 
Cela résulte aussitôt de l'égalité 


(EX A)A(E XX B)—=A4AB 
qui est immédiate. 


Théorème so. La réunion et l'intersection d'un nombre fini 
d'ensembles mesurables sont des ensembles mesurables. 

Démonstration. Il suffit, évidemment, de démontrer 
cela pour deux ensembles. Soient 4, et À, deux ensembles mesurables. 
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Cela signifie que pour tout & > 0 il existe deux ensembles élémen- 
taires B; et B; tels que 


pt (41 A B)< +, pt (4 A B) <<. 
Etant donné que 
(41 U 42) A(Bi U B2)€ (4: AB:) U (42ABh), 


on à 
[AU 42) À (BU B2)]< p* (41 À Bs)+u* (42 À B2) <e. 


Comme B; |} B: est un ensemble élémentaire, on en déduit que l’en- 
semble À, |] A: est mesurable. 

La mesurabilité de l'intersection de deux ensembles mesurables 
découle du théorème 4 et de la relation 


AN 42 =E XIE NX AU (EX A2) (4) 


Corollaire. La différence et la différence symétrique de deux 
ensembles mesurables sont des ensembles mesurables. 
Ceci resulte des théorèmes 4 et 5 et des égalités 


A X A2 = Aif (EX Ab), 
A1AA42 = (41 X 42) U (42 X Au). 


Théorème 6. Si A4, ..., À, sont des ensembles mesurables 
deux à deux disjoints, alors 


n n 
n (QU, 4:)= 2 u (Aa). (5) 
Pour démontrer ce théorème on a besoin du lemme suivant. 
Lem me. Quels que soient les ensembles À et B, 
[u* (4) — u* (B)I<u* (4AB). 
Démonstration du lemme. Comme 
AC B1|) (4 A B), 
en vertu du théorème 3 on a 
n* (4) < u* (B) + u* (4 À B). 


Si u* (4) > u* (B), le lemme résulte immédiatement de cette iné- 
galité. Dans le cas où u* (4) < u* (B) le lemme découle de l’iné- 


galité 
u* (B) <u* (4) + u* (4 À B) 


qui peut être établie de la même façon. 
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Démonstration du théorème 6. Comme dans le 
théorème », il suffit de considérer le cas de deux ensembles. Choisis- 
sons & >> 0 arbitraire et deux ensembles élémentaires BP, et B; tels que 


u* (41 À B;)<&, (6) 
U* (42 À Bo) <'&. (7) 


Posons À = 4, || A2 et B — B, [|] B:. L'ensemble À est mesurable 
en vertu du théorème 5. Les ensembles 4, et 4: étant disjoints, on a 


B; N B2C (41 À Bi) U (42 À B:) 


et, par conséquent, 


m'(B;N B2) < 2e. (8) 
En vertu du lemme, ees inégalités (6) et (7) impliquent que 
[m'(B;)—u*(A)[< 8 (9) 
et 
im’ (B:)—u* (41 <e. (10) 


Comme la mesure les ensembles élémentaires est additive, de (8)-(10) 
on déduit que 


m'(B)=m'(B;)+m'(B:)—m'(B,NB2:)>u*(4:) + u* (42) — 4e. 
En remarquant encore que 
À ÀA BE (4; À Bi) U (42 À Bi), 
on obtient : 
n*(4) m(B)—u*(4 À B) >m'(B)— 2e u* (41) + u* (42) —6e. 

Comme € >> 0 peut être choisi aussi petit que l’on veut, on a 

n* (A4) æu* (41) + n* (42). 
L'inégalité de sens contraire 

n*(4)< u* (41) +n* (42) 
étant toujours vraie (en vertu du théorème 3), on obtient finalement 


n° (4) =u* (41) +u* (42) ; 
comme les ensembles A,, A, et À sont mesurables, on peut remplacer 
ici U* par p. 
Le théorème est démontré. 
De ce théorème il résulte, en particulier, que pour tout ensemble 
mesurable À on a 


u (EX 4) = 1 — pu (4). 
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Théorème 7. La réunion et l'intersection d'une famille dé- 
nombrable d'ensembles mesurables sont des ensembles mesurables. 


Démonstration. Soit 
À, A0, Ans... 


une famille dénombrable d’ensembles mesurables et soit À — U An. 
n—1 


n—1 00 
Posons An — An XÙU An. Test clair que À — {|} 4; et les ensem- 
bles À, sont deux à deux disjoints. D’après le théorème 5 et son corol- 
laire, tous les ensembles 4x sont mesurables. D’après le théorème 6 
et la définition de la mesure extérieure, pour tout n fini on a 


3 


 H(4k)=HQU A4:)<u*(4); 
k—1 k=1 


de ce fait, la série 
2: u (4x) 


est convergente et, par conséquent, pour tout & >> 0 il existe W tel 
que 


u , E 
À HA) < + : (41) 
n>œN 
N 
L'ensemble € — [J À étant mesurable (comme réunion finie d’en- 
n=1 
sembles mesurables), il existe un ensemble élémentaire B tel que 
u*(C A B)<—+. (12) 


Comme 


AABCE(CAB)U(CU 4»), 


n>N 
de (11) et (12) on déduit que 
u* (4 A B)< 2, 
c.-à-d. que À est mesurable. 
Etant donné que les complémentaires des ensembles mesurables 


sont des ensembles mesurables l'affirmation du théorème relative- 
ment à l'intersection découle de l'égalité 


MN Ar = EXU(EX An). 


Le théorème 7 est un renforcement du théorème 9. Le théorème 
qui suit est un renforcement analogue du théorème 6. 
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Théorème 8. Si {A,} est une suite d'ensembles mesurables 
deux à deux disjoints et À — |JA,, alors 
n 


u(4)=Yu(An). 
ñn 
Démonstration. D’après le théorème 6, pour tout V on 


N N 
WU 45)= À (4) <u(4). 


En passant à la limite pour V —- co, on obtient 


n(4> 2 h(4n) (13) 
D'autre part, en vertu du théorème 3, 
a (AE Ÿ a (4) (44) 


De (13) et (14) on déduit la proposition annoncée. 

La propriété de la mesure, établie dans le théorème 8, a été appe- 
lée additivité dénombrable ou o-additivité. Elle entraîne la propriété 
suivante de la mesure, appelée continuité. 


Théorème 9, Si A,=> 4:35... est une suite décroissante 
d’ensembles mesurables et À — [\A,, alors 


u (4)= lim a (An). 


Démonstration. Il suffit de considérer le cas où À — @; 
le cas général se réduit à celui-là, lorsqu'on remplace À, par A, X À. 
On a 


A1 = (41 X 42) U (42 X 43) U ... 
et 
An — (An NX An+1) U (An+1 NX An+2) U .….. 


Les termes de ces réunions étant deux à deux disjoints, en vertu 
de l’additivité dénombrable de u, on a 


n(4)= 2H (AN An+1) (15) 
et 


U (4)= 2u (Az Ans). (16) 
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Comme la série (15) est convergente, son reste (16) tend vers 0, lors- 
que n —+ oo. Ainsi, 


u (4h) — 0, lorsque nr —+ oo, 


ce qu'il fallait démontrer. 
Corollaire. Si AS A2... est une suile croissante d'en- 


sembles mesurables et À — |] A,, alors 
n 
u (4)= lim u (4). 
ñn—00 


Pour la démonstration il suffit de passer des ensembles À, à 
leurs complémentaires et utiliser le théorème 9. 

Signalons, pour conclure, encore le fait évident, mais important, 
suivant. Tout ensemble À, dont la mesure extérieure est nulle, est mesu- 
rable. Il suffit de poser B — @; alors 


u* (4 À B) = u* (4 À D) = u* (4) = 0 < &. 


Ainsi, nous avons étendu la notion de mesure des ensembles élé- 
mentaires à une famille d’ensembles plus générale Nr, close par rap- 
port aux réunions et intersections dénombrables, c.-à-d. possédant 
la structure de o-algèbre. La mesure construite est o-additive sur 
cette famille. Les théorèmes établis plus haut permettent de donner 
la description suivante de la famille des ensembles mesurables au 
sens de Lebesgue. 

Tout ensemble ouvert appartenant à Æ peut être mis sous la forme 
d’une réunion finie ou dénombrable de rectangles ouverts, c.-à-d. 
d’ensembles mesurables ; par conséquent, en vertu du théorème 7, 
tous les ensembles ouverts sont mesurables. Les ensembles fermés 
sont les complémentaires des ensembles ouvrets; c’est pourquoi ils 
sont eux-aussi mesurables. Selon le théorème 7, sont mesurables aussi 
tous les ensembles qui peuvent être obtenus des ouverts et fermés à 
l’aide d’un nombre fini ou d’une infinité dénombrable de réunions et 
intersections dénombrables. On peut néanmoins montrer que ces 
ensembles n'épuisent pas tous les ensembles mesurables. 

3. Compléments et généralisations. Plus haut nous n’avons consi- 
déré que des ensembles contenus dans le carré unité £ — {0 < x 
y 1}. Cette restriction peut être facilement levée, par exemple, de 
la manière suivante. En représentant le plan tout entier par la réunion 
des carrés semi-ouverts En = {n<x<n+1,m<y<m +} 
(où x et m sont des entiers relatifs), nous dirons qu’un ensemble de 
points du plan À est mesurable, si son intersection A,» — À f Erm 
avec chacun de ces carrés est mesurable. Sa mesure est, par définition, 

n (4) = ÿ u(Anm). 


n,m 


La série figurant au second membre est soit convergente vers un nom- 
re fini, soit divergente vers+co. C’est pourquoi la mesure u peut pren- 
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dre aussi des valeurs infinies. Toutes les propriétés de la mesure et 
des ensembles mesurables, établies plus haut, s'étendent de façon 
évidente à ce dernier cas. Il importe de noter seulement que la réu- 
nion d’une infinité dénombrable d’ensembles mesurables de mesure 
finie peut avoir une mesure infinie. Désignons la famille de tous les 
ensembles mesurables du plan par Ÿ. 

Nous avons exposé dans ce paragraphe la construction de la me- 
sure de Lebesgue pour les ensembles du plan. De maïnière analogue 
on peut construire la mesure de Lebesgue sur la droite, dans l’espace 
à trois dimensions et, plus généralement, dans un espace euclidien 
de dimension arbitraire n. Dans tous ces cas la méthode de construc- 
tion de la mesure est toujours la même : à partir de la mesure, définie 
préalablement sur une famille d'ensembles simples (rectangles dans 
le cas du plan, intervalles ouverts (a, b), fermés [a, b] et semi-ou- 
verts (a, b], La, b) dans le cas de la droite, etc.), on définit d'abord 
la mesure pour les réunions finies de tels ensembles et on l’étend en- 
suite à des ensembles beaucoup plus généraux, dits mesurables au 
sens de Lebesgue. La définition même de la mesurabilité s'étend sans 
modification aux ensembles des espaces de n'importe quelle dimen- 
sion. 

En introduisant la notion de mesure de Lebesgue, nous sommes 
partis de la notion habituelle d’aire. La construction analogue pour 
le cas d’une seule dimension s'appuie sur la notion de longueur d’un 
intervalle (ouvert, fermé ou semi-ouvert). Mais dans ce dernier cas 
la mesure peut être introduite aussi d’une autre façon, plus générale 
que la précédente. 

Soit F (t) une fonction non décroissante et continue à gauche sur 
la droite numérique. Posons 


m (a, b)=F(b) — F(a +0), 

m la, bd —=F(b +0) —F (a), 

m (a, bl=F(b+0)—F (a + 0), 
m [a, b) = F(b) — F (a). 


1l est aisé de voir que la fonction d'intervalle m ainsi définie est non 
négative et additive. À partir de cette fonction, par des raisonnements 
analogues à ceux que l’on a déjà utilisés dans ce paragraphe, on peut 
construire une mesure ur (A), telle que la famille A, des ensembles, 
mesurables au sens de cette mesure, soit close pour les réunions et les 
intersections dénombrables et que la mesure u# elle-même soit o- 
additive. La famille A, dépend, en général, du choix de la fonction 
F. Toutefois, quel que soit le choix de F, tous les ensembles ouverts 
et fermés et donc toutes leurs réunions et intersections dénombrables, 
sont nécessairement mesurables. Toute mesure, construite à l’aide 
d’une telle fonction #, s'appelle mesure de Lebesgue-Stieltjes. En par- 
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ticulier, à la fonction F (t) = t correspond la mesure de Lebesgue 
habituelle sur la droite. 

Si la mesure u# prend la valeur 0 pour tout ensemble dont la me- 
sure de Lebesgue habituelle u est nulle, on dit que la mesure u4 est 
absolument continue (par rapport à u). Si la mesure u} est concentrée 
toute entière en un ensemble fini ou dénombrable de points (ceci 
peut se présenter dans le cas où l’ensemble de valeurs de F est fini 
ou dénombrable), on dit qu’elle est discrète. La mesure u# est dite 
singulière, si elle est nulle pour tout singleton, mais il existe un en- 
semble M de mesure de Lebesgue nulle dont le complémentaire a 
la mesure ur égale à 0. 

On peut montrer que toute mesure u} peut être représentée comme 
somme de trois mesures dont l’une est absolument continue, la se- 
conde discrète et la troisième singulière. Nous reparlerons encore des 
mesures de Lebesgue-Stieltjes au chapitre suivant. 

Existence des ensembles non mesurables.N ous avons vu que les ensem- 
bles mesurables selon Lebesgue sont très généraux. Il est donc natu- 
rel de se demander, s’il existe en général des ensembles non mesu- 
rables. Montrons que la réponse à cette question est affirmative. Le 
plus simple est de construire des ensembles non mesurables sur une 
circonférence sur laquelle est définie la mesure linéaire de Lebesgue, 

Soient C une circonférence de longueur { et &« un nombre irration- 
nel quelconque. Rapportons à une même classe tous les points de la 
circonférence C qui peuvent être amenés à coïncider, en faisant tour- 
ner la circonférence C d’un angle égal à nan (où n est un entier arbi- 
traire). Chacune de ces classes comportera, évidemment, un ensemble 
dénombrable de points. Choisissons un point dans chacune de ces 
classes. Montrons que l’ensemble ainsi obtenu (désignons-le par Dj) 
n’est pas mesurable. Notons par D, l’ensemble obtenu de D, par une 
rotation d'angle na. Il est aisé de voir que tous les ensembles D, 
sont deux à deux disjoints et que leur réunion vaut la circonférence C 
toute entière. Si l’ensemble ®, était mesurable, il en serait de même 
de tous les ensembles ®,, qui lui sont congruents. Comme 


C — U Dh, Dh DPn=@ pour nm, 


N—=— 00 


en vertu de la o-additivité de la mesure il s’ensuivrait que 


= D (D), (17) 


N== — oO 


Or, les ensembles congruents doivent avoir la même mesure, de sorte 
que si D, est mesurable, on doit avoir 


M (D,) — M (D). 
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Cela signifie que l'égalité (17) est impossible, car la somme de la série 
du second membre est nulle, si u (D5) = 0, et infinie, si u (Do) > 0. 


Ainsi, l’ensemble ®, (et, donc, chacun des ensembles ®,) est non 
mesurable. 


$ 2. Notion générale de mesure. Prolongement 
de la mesure d’un demi-anneau à un anneau. 
Additivité et o-additivité !) 


1. Définition de la mesure. Nous avons construit la mesure des 
ensembles du plan, en partant de la mesure (l’aire) d’un rectangle 
et en l’étendant à des ensembles plus généraux. Pour nos construc- 
tions ce n’était nullement l’expression concrète de l’aire du rectangle 
qui importait, mais seulement ses propriétés générales. Plus préci- 
sément, lors de l’extension de la mesure des rectangles aux ensembles 
élémentaires nous nous sommes basés seulement sur les faits que l’aire 
est une fonction d'ensemble non négative et additive et que les 
rectangles du plan forment un demi-anneau. Pour la construction de 
la mesure de Lebesgue sur le plan nous avons utilisé, en outre, l’addi- 
tivité dénombrable. 

D'après ce qu’on vient de dire, la construction exposée au $ 1 
pour les ensembles du plan peut être exprimée sous une forme abstraite 
très générale. Par cela même son champ d’application sera considé- 
rablement élargi. C’est précisément cette question qui fait l’objet 
des deux paragraphes suivants. 

Introduisons tout d’abord la définition fondamentale suivante. 

Définition {. Une fonction d'ensemble u (A) s'appelle me- 
sure, Si: 

1) le domaine de définition @, de la fonction u (4) est un demi- 
anneau d’ensembles, 

2) les valeurs de la fonction u (4) sont réelles et non négatives, 

3) la fonction u (4) est additive, c.-à-d. pour toute décomposition 
d'un ensemble À € ©, en réunion finie 


= À,{ .. UAn 


d’ensembles (deux à deux disjoints) Az € ©, on a l'égalité 


n 


u (4) — À u (Az). 


Remarque. De la décomposition @ — @ {|} @ on déduit 
que u (D) = 2u (D), d'où u (S) = 0. 

2. Prolongement de la mesure d’un demi-anneau à l’anneau qu’il 
engendre. En construisant la mesure des ensembles du plan on a 


1) Dans ce paragraphe et plus loin nous utiliserons systématiquement les 
notions et les résultats exposés au $ 5, chap. I. 


17—0167 
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commencé par étendre la mesure des rectangles aux ensembles élé- 
mentaires, C.-à-d. aux réunions finies de rectangles deux à deux dis- 
joints. Nous considérerons maintenant une construction analogue 
abstraite. Formulons d’abord la définition suivante. 

Définition 2 La mesure u s'appelle prolongement de la 
mesure m, Si ©» © ©, et pour tout À € ©, on a l'égalité 


u (4) = m (4). 


Notre objectif dans ce numéro est de démontrer la proposition 
suivante. 

Théorème 1. Pour toute mesure m (A) donnée sur un demi- 
anneau ©m, il existe un prolongement et un seul m'(A) ayant pour 
domaine de définition l'anneau NW (©) (c.-à-d. l'anneau minimal 
engendré par Gx). 

Démonstration. Pour tout ensemble AE (S,) il 
existe une décomposition de la forme 


A=U Br (BE Om: Br Br =@Q,sik#l) (1) 
(cf. théorème 3, $ 5, chap. I). Posons, par définition, 
m' (4)= 2 m (B»), (2) 


Il est aisé de voir que la grandeur m'(A), définie au moyen de l’éga- 
lité (2), ne dépend pas du choix de la décomposition (1). En effet, 
considérons deux décompositions 


A = Ù, B; — U, C;y, BiEGn, CE Em. 
i= i= 


Comme toutes les intersections B; N C; appartiennent à ©, en vertu 
de l’additivité de la mesure m, on a 
n T 


D m(Bi)= 2; 2 m (BiNC)= 2 m (C;), 


ce qu'il fallait démontrer. 

La non-négativité et l’additivité de la fonction m' (4), définie 
par l’égalité (2), sont évidentes. Aïnsi, l'existence du prolongement 
m' de la mesure m à l’anneau À (©Sh) est démontrée. 

Pour démontrer son unicité remarquons que, d’après la défini- 


n 
tion du prolongement, si À — |} B;, où B, sont des ensembles deux à 
k=1 
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deux disjoints de @,,, alors pour tout prolongement m de la mesure m 
à l'anneau NÀ (©») on a 


=> m (B3) — 21m (B4) = m" (4), 


"1 d. la mesure m coïncide avec la mesure m’, définie par l'éga- 


é (2). 


Et théorème est démontré. 


Lé Le Q Q 


utilisé déjà au $ 1 pour prolonger la mesure des Rctanples aux ensem- 
bles élémentaires. Par ailleurs, l’anneau minimal engendré par le 
demi-anneau des rectangles est constitué précisément par les ensem- 


bles élémentaires. 
L'additivité et la non-négativité de la mesure entraînent les pro- 


priétés presque évidentes, mais importantes, que voici. 


Théorème 2. Soient m une mesure, définie sur un anneau quel- 
conque Rim) et A1, A», . .., An des ensembles appartenant à À» 


Alors 
I. si U AC Aet À, N dj = © pour iÆj,on a 


R=! 
n 


D m(A)<m (4); 


II. si || 4, ÀA,on a 
k=—1 


n 


2 m(A:)>m (À); 


en particulier, si AC À'et À, AE À, alors m (4) £ m (4°). 


En effet, si les ensembles 4,, ..., À, sont deux à deux dis- 
joints et Lous inclus dans À, en vertu de l’additivité de la mesure, on a 


n 


m (A) — 2 m (4x)-m(AX U A). 


Puisque m (AN U 4) Z 0, on en déduit la propriété I. 
D'autre part, quels que soient A,, A EN», on a 
m (Ai U 42) = m(4;)+m (42) — m( 411 42) < m (4;) +m (4 2). 


Par récurrence, il vient 
n 


m(U A» )< 2 m (4:). 
47% 
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ñn 
Enfin, toujours grâce à l’additivité de la mesure, de AC {|} 4, il 
hk=1 
résulte que 


m (4)=m (Ù A5)— mn Ü, ANA) m QÙ 4), 


d’où, en vertu de l'inégalité précédente, on obtient la propriété II. 

Nous avons démontré les propriétés I et II pour une mesure défi- 
nie sur un anneau d'ensembles. Mais si une mesure est donnée d’abord 
sur un demi-anneau et puis on la prolonge sur un anneau, la mesure 
des ensembles appartenant au demi-anneau initial ne change pas. 
C'est pourquoi les propriétés I et II sont vraies aussi pour les mesures 
définies sur un demi-anneau. 

3. 6-additivité. Dans certaines questions de l’analyse on est amené 
à considérer non seulement des réunions finies, mais aussi des réunions 
dénombrables d’ensembles. C’est pourquoi il est naturel de remplacer 
la condition d’additivité que nous avons imposée à la mesure (cf. 
définition 1) par la condition plus forte de o-additivité. 

Définition 3. La mesure m est dite dénombrablement addi- 
tive ou o-additive, si, quels que soient les ensembles À, A4, A», . . .” 
..., An, +... appartenant à son domaine de définition ©, et véri- 
fiant les conditions 


A= Ü An AinA;j=@ pour is j, 
n—1 
on a l'égalité 
m (4) = à m (A;). 


La mesure de Lebesgue sur le plan, construite au $ 1, est o-addi- 
tive (théorème 8). On peut construire un exemple de mesure o-addi- 
tive d’une toute autre nature de la manière suivante. Soient un ensem- 
ble dénombrable arbitraire 


X = {t1, Lo, . . .}, 
et des nombres p,>0 tels que 


» Pn = 1. 
n=1 


À titre d’ensembles mesurables on prend tous les sous-ensembles de 
l’ensemble X, en posant pour chaque AC X 


u(4)= à Pn- 
Xn£A 


Il est aisé de vérifier que m (À) est une mesure o-additive et qu’en 
outre m (X) — 1. Cet exemple apparaît de façon naturelle dans 
de nombreuses questions de la théorie des probabilités. 
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Indiquons un exemple de mesure additive, mais non o-additive. 
Soit X l’ensemble de tous les points rationnels du segment [0, 11]. 
Supposons ©, constitué des intersections de À avec toutes sortes 
d’intervalles ouverts (a, b), fermés [a, b] et semi-ouverts (a, b], 
[a, b) du segment [0, 1]. Il est facile de voir que ©» est un demi- 
anneau. Pour chaque ensemble A,r € ©Œm posons 

m (Ab) = db — a. 


Cette mesure est additive, mais elle n’est pas o-additive, car m (X) — 
— À et en même temps X est une réunion dénombrable de points dont 
chacun a la mesure égale à 0. 

Toutes les mesures considérées ici et dans le paragraphe suivant 
seront supposées o-additives. 


Théorème 3. Si la mesure m, définie sur un demi-anneau ©» 
est c-additive, alors la mesure 1, obtenue par son prolongement à l’an- 
neau À (©m) est aussi o-additive. 


Démonstration. Soient 
AER (Om), By ER (Sn), n = 1, 2, RE | 


B:,N B, = © pour sr. 
et 


A= |) Bh. 
n=1 
Alors il existe des ensembles À; et B,; de ©, tels que 


À = U À;, Br= UBni, n—1,2, ..., 
J î 


tous les ensembles figurant aux seconds membres de ces égalités étant 
deux à deux disjoints et toutes les réunions étant finies (théorème 3, 
$ 9, chap. Î). 

Posons Ch;j = Bh; N A;j. Il est aisé de voir que les ensembles 
Cn;; sont deux à deux disjoints et que 


Donc, puisque la mesure m sur ©, est o-additive, on a 
m(4ÿ)= 2: 2m (Cnis), (3) 
m (Bai) = 21m (Cri). () 
3 
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D'après la définition de la mesure u sur À (©) 
uA= Dim (4;), (9) 
J 


H(Br)= 2m (Bai). (6) 
De (3)-(6) il résulte que 


M (A) = à M (Ph) * 


(Les sommes par rapport aux indices i et j ici sont finies et les séries 
par rapport à n sont convergentes.) 

Démontrons maintenant les propriétés fondamentales suivantes 
des mesures o-additives qui représentent la généralisation au cas 
d’une réunion dénombrable d’ensembles des propriétés formulées 
dans le théorème 2. Puisque, comme nous l’avons montré, l’additi- 
vité dénombrable d’une mesure subsiste lorsque cette mesure est pro- 
longée d’un demi-anneau à l’anneau correspondant, nous pouvons 
supposer dès le début que la mesure est donnée sur un anneau fi. 


Théorème 4 Soient m une mesure o-additive, et À, 
A1, ..., An, . . . des ensembles appartenant à l'anneau %. Alors: 


Is. Sil AC A etA;f A; = @pouriZÆj,ona 
k=1 


CO 


>, m(Ar)<m (À) ; 


k—1 


Il, (sous-additivité dénombrable). Si D Ar A,on «a 
k—1 


À m (4) >m (4) 


Démonstration. Si tous les 4, sont deux à deux disjoints 
et inclus dans À, en vertu de la propriété I (théorème 2), pour tout n 
on à 
n 


à m (Ar) m (A). 


En passant ici à la limite pour n — œ, on obtient la première affir- 
mation du théorème. 

Démontrons la deuxième affirmation. Comme % est un anneau, 
les ensembles 


n—i 
Pa — (An MN Ba) U, Àh 
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appartiennent à À. Puisque 


A= Ü Br BrCAa 
— 1 


n 


et les ensembles B, sont deux à deux disjoints, on a 


m(4)= 2 m(B1)< 2, m (An), 


Remarque. L’affirmation I, du théorème que l’on vient de 
démontrer ne s’appuie évidemment pas sur l’additivité dénombrable 
de la mesure considérée ; elle reste donc vraie aussi pour des mesures 
additives arbitraires. Par contre, l'affirmation IT, utilise essentielle- 
ment l’additivité dénombrable de la mesure. En effet, dans l’exemple 
de mesure addilive, mais non oc-additive, considéré plus haut, l’en- 
semble X de mesure totale 1 est recouvert par une famille dénombra- 
ble de singletons dont chacun est de mesure nulle. De plus, il est aisé 
de se convaincre que la propriété II, en réalité équivaut à l’addi- 
tivité dénombrable. En effet, soit u une mesure quelconque, définie 
sur un demi-anneau @. Soient À, A1, ..., A,, . .. des ensembles 
de & tels que À — |) À;,, tous les À, étant deux à deux disjoints. 

k 


Alors, en vertu de la propriété I, (qui est, comme nous l'avons vu, 
vraie pour n'importe quelle mesure), on a 


2: H (4) <H (4). 


Si, en outre, u jouit de la propriété IT,, alors (puisque les ensembles 
Ax forment un recouvrement de À) 


DH (4) >u (4) 
et, par conséquent, 


>, a (4x) = u (4). 
n=1 


Il est souvent plus facile de vérifier la sous-additivité dénombrable 
d’une mesure (propriété IT,) que d'établir directement son additivité 
dénombrable. 


$ 3. Prolongement d’une mesure selon Lebesgue 


1. Prolongement selon Lebesgue d’une mesure définie sur un demi- 
anneau avec unité. Si une mesure m, donnée sur un demi-anneau 
Sn, jouit seulement de la propriété d’additivité (et non de celle de 
o-additivité), son prolongement à l’anneau À (@) épuise pratique- 
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ment toutes les possibilités d'étendre cette mesure du demi-anneau 
initial à une famille d’ensembles plus large. Si, par contre, la inesure 
considérée est o-a dditive, elle peut être étendue de €, à une 
famille d’ensembles beaucoup plus large que l’anneau % (@,.) et 
en quelque sens maximale. Cela peut se faire à l’aide du procédé dit 
prolongement selon Lebesgue. Nous considérerons 
d’abord le prolongement selon Lebesgue d’une mesure donnée sur un 
demi-anneau avec unité. Le cas général sera étudié au numéro suivant. 

Soit m une mesure 6-additive donnée sur un demi-anneau d’en- 
sembles ©, dont £ est l'unité. Définissons sur la famille Y de tou- 
tes les parties de l’ensemble Æ une fonction u* (A), dite mesure exté- 
rieure de À, de la manière suivante. 

Définition 1. On appelle mesure extérieure de l’ensemble 


AE le nombre 
u* (4) = inf 2m (Bn), (1) 


où la borne inférieure s'étend à tous les recouvrements de l’ensemble 
A par des familles finies ou dénombrables d’ensembles B, € &. 

La propriété suivante de la mesure extérieure joue un rôle fonda- 
mental dans toute la construction qui va suivre. 


Théorème 1 (sous-additivité dénombra- 
ble). Si 
AC Ua, 


où {A, } est une famille finie ou dénombrable d'ensembles, alors 
p* (4)< Z'H* (4). 


La démonstration de cette proposition est exactement la même 
que celle du théorème 3, $ 1, et nous ne la reproduirons pas ici. 
Définition 2. Un ensemble À est dit mesurable (au sens de 
Lebesgue), si, quel que soit e >> 0, il existe un ensemble B € À (S,) 
tel que 
u* (4 À B)< 2. 


La fonction u*, considérée seulement sur les ensembles mesura- 
bles, s'appelle mesure de Lebesgue (ou simplement mesure) et se note u. 
Il est clair que tous les ensembles de @G,, et de À (©) sont mesu- 
rables. De plus, si AE G»,ona 


un (4) = m (4). 
Cette égalité se démontre exactement comme pour les ensembles du 
plan. 
De l'égalité 
Ai A As = (EX A4) A (EX À4)) 
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il résulte que si l’ensemble À est mesurable, son complémentaire 
l'est aussi. 

Etablissons maintenant les propriétés fondamentales des ensem- 
bles mesurables et de la mesure de Lebesgue qui leur est associée. 


Théorème 2. La famille M de tous les ensembles mesurables 
est un anneau. 

Démonstration. Puisqu'on a toujours 

A1 N 42 = Ai (41 X 42) 
et 
Ai U 42 = E XIŒ A4) N (Œ KA2)l, 

il suffit de démontrer que si A,E€ M et A2 EM, alors À — 
= A,;X A4: EM. 

Supposons À, et A: mesurables; il existe alors B, ER (©) 
et B> CR (©) tels que 


u* (4 À B1) << et p* (42 À B) << +: 


En posant B — B, KB, ER (©) et en utilisant la relation 
(41 X 42) À (Bi X B2) € (41 À B;) U (42 À B:), 
on obtient 
u* (4 À B)<e. 
Comme e >> 0 est aussi petit que l’on veut, on en déduit que l’en- 
semble À est mesurable. 


Remarque. Il est évident que £ est l’unité de l’anneau 
qui, de ce fait, est une algèbre d'ensembles. 


Théorème 3. La fonction u (A), définie sur la famille M des 
ensembles mesurables, est additive. 


La démonstration de ce théorème est exactement celle du théo- 
rème 6, $ 1. 


Théorème 4. La fonction un (4), définie sur la famille M des 
ensembles mesurables, est o-additive. 


Démonstration. Soient 
À, An An +. EM, A— Ü An, 
n=1 
Ai N 4j= D pour i£j. 


D'après le théorème 1, 
h (4)< 2H (4n). (2} 
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En vertu du théorème 3, pour tout Nona 


N N 
h(4)Zu(U An)= 2! u (An), 


NS n= 
d'où 


n (422 u (An). (3) 


De (2) et (3) on obtient l’assertion annoncée. 

Au $ 1, en considérant la mesure de Lebesgue sur le plan, nous 
avons montré que la réunion et l'intersection d’une famille d’ensem- 
bles mesurables sont des ensembles mesurables non seulement dans 
le cas où cette famille est finie, mais aussi dans le cas où elle est 
dénombrable. Ceci est vrai aussi dans le cas général, c.-à-d. on a le 
théorème suivant: 


Théorème ss. La famille M des ensembles mesurables au sens 
de Lebesgue est une o-algèbre dont E est l'unité. 


Démonstration. Comme 
MN An=E U(EX A4) 


et le complémentaire d’un ensemble mesurable est aussi mesurable, 
il suffit de démontrer que si les ensembles À,, 4», ..., An, ... 
appartiennent à M?, il en est de même de l’ensemble À — |} À,. 


n 
La démonstration de cette affirmation, exposée dans le théorème 7 
du $ 1 pour des ensembles du plan, s'étend mot à mot au cas général. 
De même que dans le cas de la mesure de Lebesgue sur le plan, 
l’additivité dénombrable d’une mesure entraîne sa continuité. Au- 
trement dit, u étant une mesure o-additive définie sur une o-algèbre, 


si AD A» D... > À, >... est une suite décroissante 
d’'ensembles mesurables et 
À = N Am 
ñn 
alors 


p (4)= lim p (An) ; 


de même, si AC A4:C...CA,C... est une suite crois- 
sante d’ensembles mesurables et 
À — U An; 
n 
alors 


pu (4)= lim pi (An)« 


ñn— 00 


La démonstration de cette assertion, exposée au $ 1 pour la mesure 
sur le plan (théorème 9), s'étend mot à mot au cas général. 
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Ainsi, nous avons démontré que la famille St est une o-algèbre 
et que la fonction u (A) définie sur M jouit de toutes les propriétés 
d’une mesure o-additive. Ceci justifie la définition suivante. 

Définition 3. On appelle prolongement selon Lebesgue 
u — L(m) d’une mesure m toute fonction u (4), définie sur la 
famille M des ensembles mesurables et coïncidant sur Mt avec la 
mesure extérieure u* (4). 

2. Prolongement d’une mesure donnée sur un demi-anneau sans 
unité. Si le demi-anneau ©, sur lequel est définie la mesure initia- 
le m, n’a pas d'unité, la construction du prolongement de Lebesgue, 
exposé au numéro précédent, subit quelques modifications, d’ail- 
leurs, insignifiantes. La définition 1 de la mesure extérieure est 
gardée, mais la mesure extérieure u* se trouve définie seulement 
sur la famille S,+ des ensembles À dont chacun possède un recouvre- 


ment || B, par des ensembles de @,. tel que la somme > m (B,) 
n n 


ait une valeur finie. La définition de la mesurabilité est conservée 
sans aucun changement. 

Les théorèmes 2-4 et la définition 3 restent valables. L'hypothèse 
d'existence de l’unité a été utilisée seulement dans la démonstration 
du théorème 2. Pour démontrer le théorème 2 dans le cas général, 
il faut établir indépendamment de cette hypothèse que À, € M et 
A» € M entraînent À, |} A: E M. Or, ceci découle de l'inclusion 


(4; U 42) À (Bi U B2) € (43 À Bi) U (42 À B)). 


Lorsque ©, n’a pas d'unité, le théorème 5 est remplacé par le théo- 
rème suivant : 


Théorème G. Pour toute mesure initiale m la famille M des 
ensembles mesurables au sens de Lebesgue est un o-anneau ; la mesura- 


bilité de l’ensemble À — |] À, pour A, mesurables a lieu si et seule- 
n=1 


N 

ment si les mesures u ( LU An) sont majorées par une constante indé- 
1 — 

pendante de N. 

La démonstration de cette proposition est laissée au lecteur. 

Remarque. Etant donné que maintenant il s’agit de mesu- 
res qui ne prennent que des valeurs finies, la nécessité de la 
dernière condition est évidente. 

Du théorème 6 découle le résultat suivant. 

Corollaire. La famille M, de tous les ensembles B € M, 
sous-ensembles d’un ensemble fixe À € JM, est une o-algèbre. 

Par exemple, la famille de tous les sous-ensembles d’un segment 
arbitraire [a, b], mesurables selon Lebesgue (au sens de la mesure 
de Lebesgue habituelle sur la droite), est une o-algèbre d’ensembles. 

Signalons, enfin, encore une propriété des mesures de Lebesgue. 
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Définition 4. Une mesure u est dite complète, si de u (4A)— 
— 0Oet 4’ & À il résulte que À” est mesurable. 

Il est évident qu'’alors u (4’) — 0. On démontre sans peine 
que le prolongement selon Lebesgue de toute mesure est complet. En 
effet, si 4’ € À et u (4) = 0, on a nécessairement u* (4’) — 0; 
or, tout ensemble C, tel que u* (C) — 0, est mesurable, parce que 


DER (En) et 
u* (C A @) = u* (C) = 0. 


Toute mesure o-additive sur une o-algèbre peut être prolongée 
jusqu'à une mesure complète, en admettant qu'elle soit nulle pour 
tout sous-ensemble d’un ensemble de mesure nulle. 


Remarques supplémentaires. 1. La supposition que la 
mesure initiale m est définie sur un demi-anneau (et non sur une famille arbitrai- 
re d'ensembles) est importante pour l’unicité de son prolongement. Considérons 
dans le carré unité l’ensemble des rectangles ver- 
ticaux et horizontaux, c.-à-d. des rectangles ayant 
la longueur ou la largeur égale à 1 (fig. 18) et 
attribuons à chacun de ces rectangles une mesure 


7 égale à son aire. Une telle mesure peut être pro- 
D Fe 


AU longée sur l'algèbre (et, à plus forte raison, sur la 
W V0 6-algèbre), engendrée par ces rectangles, de façons 
Z différentes (indiquer au moins deux prolongements 
7 distincts). 

72 ; 2. Signalons le lien existant entre le procédé 
0 / Z de prolongement d’une mesure selon Lebesgue et le 

Fig. 18 procédé de complétion d’un espace métrique. Pour 

18° cela, remarquons qu’on peut prendre m’ (A A B) 

pour distance de deux éléments 4 et B de l’an- 

neau R(Sm). Ceci fait de R (Em) un espace métrique (en général, non 

complet) dont le complété est composé précisément de tous les ensembles 

mesurables (dans ce cas, lorsque u (4 À B) = 0, les ensembles 4 et B sont indis- 
cernables du point de vue métrique). 

Exercices. 1. Soit m une mesure donnée sur un demi-anneau (avec 
unité) Œm d’ensembles de X et soit u* la mesure extérieure associée . Démontrer 
qu'un ensemble À est mesurable (au sens de Lebesgue) si et seulement s’il jouit 
de la propriété suivante, appelée mesurabilité au sens de Carathéodory : pour tout 
sous-ensemble Z< X on a l'égalité 


p*(2) = u* (Z [1 4) + (ZA). 


2. Soit m une mesure o-additive donnée sur un anneau À dont X est l'unité 
et soit m (X) = 1. Pour chaque 4 & X introduisons, à côté de la mesure exté- 
rieure u*, la mesure intérieure u,, en posant 


x (4)=1—u* (XX A4). 


Il est aisé de voir qu'on a toujours 4 (4) < u* (4). 
Démontrer que 


Ux (4) =u* (4) (+) 


si et seulement si l’ensemble À est mesurable (au sens de la définition 2). 
Si la mesure est donnée sur un anneau avec unité, on prend souvent l'égali- 
té (x) pour définition de la mesurabilité d’un ensemble. 
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3. Extension de la notion de mesurabilité dans le cas d’une mesure 
6-finie. Si la mesure initiale m est donnée dans l’espace X sur un 
demi-anneau sans unité, la définition de la mesurabilité d’un ensem- 
ble, introduite plus haut, s’avère trop étroite. Par exemple, si X 
est le plan, les ensembles tels que le plan tout entier, la bande, 
l’extérieur d’un cercle, etc. dont l’aire est infinie, ne se trouvent 
pas conformément à cette définition parmi les ensembles mesurables. 
Il est donc naturel d’élargir la notion de mesurabilité, en admettant 
des valeurs infinies de la mesure, afin que la famille des ensembles 
mesurables possède, comme dans le cas où la mesure initiale est don- 
née sur un demi-anneau avec unité, la structure de o-algèbre (et 
non seulement de ô-anneau). 

Nous nous bornons ici pratiquement au cas le plus important de 
la mesure dite o-finie, bien que la construction correspondante 
puisse être effectuée aussi dans le cas général. 

Soit m une mesure o-additive donnée sur un demi-anneau @,, 
de parties de l’ensemble X. Nous dirons que cette mesure est o-finie, 
si l’ensemble X tout entier peut être représenté par une réunion 
dénombrable d’ensembles de ©, (et non par une réunion 
finie d’ensembles de @,,). Un exemple de mesure o-finie est 
fourni par l’aire, définie sur l’ensemble des rectangles du plan. Un 
exemple simple de mesure non o-finie peut être obtenu de la manière 
suivante. Soit une fonction jf (x) donnée sur le segment [0, 1]. Pour 
tout sous-ensemble fini À — {x,,...,x,} du segment [0, 1] posons 
u (4) = >» f (x;). Si l’ensemble des points x pour lesquels f (x) Æ 0 
est non dénombrable, cette mesure sur [0, 1] n’est pas o-finie. 

Soit donc m une mesure o-additive et o-finie dans X, définie 


sur un demi-anneau @,,. Soit À — || B;, B; € ©. En passant du 
i=1 


demi-anneau ©, à l'anneau (S,) et en remplaçant B, par 
k—1 

PB; X U B;, on peut considérer que X est exprimé sous forme d’une 
i=1 


1—= 

réunion dénombrable d’ensembles mesurables, deux à deux disjoints, 
que nous désignerons comme auparavant par B,, B:, . .. En appli- 
quant à m le procédé de prolongement selon Lebesgue décrit plus 
haut, nous obtiendrons une mesure u définie sur le o-anneau MW. 
Soit BE M. Désignons par M, la famille de tous les ensembles de 
M contenus dans B: 


M 2 — {C:C E M, Ce Bt}. 
Alors M est une o-algèbre dont B est l’unité (cf. corollaire du 
théorème 6). 
Considérons maintenant la famille Y des ensembles À dont 
l'intersection avec chaque B; est mesurable: 


| NB:E Mes. 
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Autrement dit, À € Ÿ signifie que À peut être mis sous la forme 
A= Ù A, où A;E Ms, (4) 

1—= 


La famille Y est une o-algèbre (vérifier!) que nous appellerons 
somme directe des o-algèbres Ni g,. Nous dirons que les ensembles (4) 


qui composent la o-algèbre À sont mesurables el définirons la mesure 
u de chacun de ces ensembles de la manière suivante: si 


A = Ü Ai, AC Me, 
alors 
n (4)= 2 u (45). 


Comme la mesure de tout ensemble est non négative, la série du second 
membre de cette égalité converge vers un nombre non négatif ou 
vers — co. 


Théorème 7. Sous les hypothèses faites plus haut on a les 
propositions suivantes : 
1) la o-algèbre À et la mesure u ne dépendent pas du choix de la 


famille d'ensembles disjoints B; € M vérifiant la condition |] B;— X; 
i=1 


2) la mesure pu est o-additive sur À; D 

3) la famille des ensembles A E A pour lesquels nu (4) < oo coïn- 
cide avec le ô-anneau M et sur ce d-anneau on au = pu. 

Démonstration. 1) Remarquons tout d’abord que A € 
E M si et seulement si À N C E M pour tout C E M. Cette condition 
est évidemment suffisante, parce qu'elle signifie, en particulier, que 
ANB;EM(i—1,2,...); montrons qu'elle est nécessaire. 
Soient À EX et CE M. Posons C; = CN B;; alors 


ANnC= U (4 NC). 
Comme pour tout Vona 
N N 
n (U (AACH)KUÇU CD<H(C), 


en vertu du théorème 6, l’ensemble À f\ C est mesurable. 
Soient {B;} et {B*} deux familles d’ensembles disjoints de M 
telles que |) B; = | B* — X. Si À € À, alors, comme la mesure pu 
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de tout ensemble de M est non négative, on a les égalités 


DH(ANB)= Zu(ANBNB)= Zu (AN 5), 


qui montrent qu’en définissant u (4) à l’aide de la famille {B;} 
ou de la famille {B*}, on obtient toujours le même résultat. 


2) Soient A, 4%,,...€X, A NA = @ pour k ZI 
ct À = |) A%. Comme la mesure u est o-additive sur M, on à 
k 


= Suns, Endanso 


= D (D u(AËNB;))= Y n(4%), 
k=—1 1 k=—1 


Îi— 


ce qui prouve que la mesure LL est o-additive. 
Enfin, la proposition 3) est une conséquence immédiate du théo- 


rème 6. 


Remarque. L'extension de la notion de mesurabilité décrite plus 
haut (admettant des valeurs infinies pour la mesure) peut être réalisée aussi sans 
l'hypothèse que la mesure initiale soit o-finie, par exemple, selon le schéma 
suivant. 

Soient X un espace quelconque et % un Ô-anneau quelconque de sous- 
ensembles de X. Un ensemble 4 © X est dit mesurable par rapport à M, si À ( 
N B € M pour tout B € I. On vérilie sans peine que la famille U des ensembles 
mesurables par rapport à SX est une o-algèbre dont X est l’unité; si, en outre, 
la famille S\ est elle-même une o-algèbre (avec la même unité X}, alors 1 — M. 

Considérons maintenant dans X une mesure o-additive quelconque u qui, 
d’après ce qui a été dit au n°02, peut être supposée comme étant déjà prolongée 
sur un Ô-anneau JW. Soit Ü la famille des ensembles de X, mesurables par rap- 
port à %. Un ensemble À € U s'appelle ensemble nul, si nu (4(\B) = 0 pour 
tout B € 9}. Maintenant on définit la mesure u sur U (pouvant prendre, en 
général, des valeurs infinies) de la manière suivante: si pour un ensemble donné 
A ElUilexiste un ensemble B € SX, tel que À A B est un ensemble nul, on pose 


p (4) = ni (B); 
pour tous les autres À € U on pose 


u (4) = co. 


On vérilie sans peine que la mesure u est o-additive et que sur le Ô-anneau 
SR € U elle coïncide avec pu 

4. Prolongement d’une mesure selon Jordan. En considérant dans le $ 2 de 
ce chapitre des mesures vérifiant seulement la condition d’additivité, nous avons 
montré qu'une telle mesure m peut être toujours prolongée du demi-anneau ©,, 
à l’anneau minimal X (©) engendré par ce demi-anneau. Cependant, il est 
possible de prolonger une telle mesure à un anneau plus large que RH (©). La 
construction correspondante s'appelle prolongement de la mesure selon Jordan À). 
L'idée de cette construction, utilisée dans certains cas particuliers déjà par les 


1) Camille Jordan, mathématicien français (1838-1922). 
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mathématiciens de la Grèce Antique, consiste à approcher l’ensemble « que 
l’on mesure » À par des ensembles 4’ et 4”, déjà munis de mesures, de l’inté- 
rieur et de l'extérieur, c.-à-d. de façon que 


A'CcAC À”. 
Soit m une mesure donnée sur un anneau quelconque Ji. 
Définition 5. Nous dirons qu'un ensemble À est mesurable au sens 


de Jordan, si pour tout € > 0 dans l’anneau % il y a des ensembles 4’ et 4” 
vérifiant les conditions 


A AA", m(4"\ A')<e. 
On a la proposition suivante. 


Théorème 8. La famille J* des ensembles mesurables au sens de J'or- 
dan est un anneau. 


Soit À une famille d’ensembles À dont chacun est contenu dans un ensemble 
B de À. Pour chaque À € % posons, par définition, 


u (4)= inf m(B), 
BDA 

A)= B). 

u (4) pu ) 


Les fonctions u (4) et u (4), s'appellent respectivement mesure de Jordan 


« extérieure » et mesure de Jordan « intérieure » de l’ensemble 4. 
Il est évident qu'on a toujours 


p (4) <H (4). 
Théorème 9. ZL’anneau * coïncide avec la famille des ensembles 
A EX pour lesquels (4) = u (4). 
Pour les ensembles de A on a les théorèmes suivants: 


3 


n — — 
Théorème 10. SiA« U 4 alors (4) Ÿ' pu (4). 
k— kh=1 
Théorème 11. SiA,CA(k=1,2,...,n)et A; N Aj= @, alors 


n 


u(4)> D u (An). 
kR—1 


Définissons maintenant la fonction u sur le domaine 
y = R* 
comme la valeur commune des mesures extérieure et intérieure : 
n (4) = (4)=n (4). 
Des théorèmes 10 et 11 et du fait évident que pour À € fon a 
pu (4)=p (4)=m (4) 
découle la proposition suivante: 


Théorème 12. La fonction p (A) est une mesure et un prolongement de la 
mesure m. 

La construction exposée est applicable à toute mesure m définie sur un 
anneau. En particulier, elle peut être appliquée aux ensembles du plan. Dans ce 
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cas on prend pour anneau initial la famille des ensembles élémentaires (c.-à-d. 
des réunions finies de rectangles). L’anneau des ensembles élémentaires dépend, 
évidemment, du choix du système de coordonnées sur le plan (on prend les rec- 
tangles dont les côtés sont parallèles aux axes de coordonnées). Lorsqu'on passe 
à la mesure de Jordan sur le plan, cette dépendance du choix du système de 
coordonnées disparaît: en partant d’un système de coordonnées arbitraire 


{x1, 22}, lié au système initial {x4, x2} par une transformation orthogonale 
T4 = COS Gex Sin œezo +4, 


Zi= — sin @-21—+ C08 &-To + Go, 


on obtient toujours la même mesure de Jordan. Ceci résulte du théorème général 
suivant. 


Théorème 13. Pour que les prolongements selon Jordan li = j (m1) 
et UMo = j (m2) des mesures m1 et mo, définies sur les anneaux 9 et M2, coincident, 
il faut et il suffit que les conditions suivantes soient vérifiées : 


À: C E hs m4 (4) — Ua (4) sur R4: 
Jo C Oo Mo (A)—= pa (4) sur Ro. 


Si la mesure initiale m est définie non sur un anneau, mais sur un demi- 
anneau €©,,, il est naturel d'appeler prolongement selon Jordan de m la mesure 


j (m) = j (r (m)), 


obtenue en prolongeant d’abord m à l’anneau À (©) et en prenant ensuite son 
prolongement selon Jordan. 

5. Unicité du prolongement d’une mesure. Si un ensemble À est mesurable 
au sens de Jordan par rapport à la mesure p, c.-à-d. s’il appartient à R* — 


— + (Eh), alors pour toute mesure u prolongeant m et définie sur R* la va- 


leur u (4) coïncide avec la valeur J (4) du prolongement selon Jordan J — 
— j(m). On peut montrer que le prolongement de la mesure m au-delà de la 
famille R* des ensembles mesurables au sens de Jordan n’est pas unique. Plus 
précisément, nous dirons que À est un ensemble d’unicité de la 
mesure m, Si: 

1) il existe une mesure prolongeant m et définie pour l’ensemble À ; 

2) pour n’importe quelles deux mesures de cette espèce pu et 2 on a 


ty (4) = ue (4). 


Alors on a le théorème suivant : La famille des ensembles d’unicité de la mesure 
m coïncide avec la famille des ensembles mesurables au sens de Jordan par rapport 
à la mesure m, c.-à-d. avec l'anneau i*. 

Cependant, si l’on se borne aux mesures o-additives et à leurs prolonge- 
ments (o-additifs), la famille des ensembles d’unicité est, en général, plus large. 

Comme c’est précisément le cas des mesures o-additives qui est le plus impor- 
tant, introduisons la définition suivante. 

Définition 6. Un ensemble À s’appelle ensemble de o-unicité de la 
mesure o-additive m, si: 

1) il existe un prolongement o-additif À de la mesure m, défini pour À 
(c.-à-d. tel que À € ©); 

2) pour n'importe quels deux prolongements o-additifs À, et À de ce type 


on a l'égalité 
M (4) = À2 (4). 


Si À est un ensemble de o-unicité pour la mesure o-additive nu, alors d’après 
notre définition, il existe une seule valeur possible À (4) du prolongement 
o-additif de la mesure u, défini pour À. 


18--0167 
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Il est aisé de voir que tout ensemble À mesurable au sens de Jordan est 
aussi mesurable au sens de Lebesgue (mais non réciproquement! Donner un 
exemple.) et que les mesures de Jordan et de Lebesgue pour cet ensemble ont 
la même valeur. On en déduit immédiatement que le prolongement selon Jor- 
dan d’une mesure c-additive est o-additif. 

Tout ensemble À, mesurable au sens de Lebesgue, est un ensemble de 
o-unicité pour la mesure initiale m. En elfet, pour tout € => 0, à l’ensemble À on 
peut associer un ensemble B € R tel que u* (4 À B) < &. Quel que soit le 
prolongement À de la mesure m, défini pour À, on a 


À (B) = m'(B), 
car le prolongement m’ de la mesure m à À — HN (€) est unique. D'autre part, 
à (a AB) <u*(A AB)<eE 
et, par conséquent, 
[A(4A)= m'(B)| <e. 


Ainsi, pour n'importe quels deux prolongements o-additifs À, et À de la mesure 
m on à 
[A4 (4) — A (A4) 1<2e, 


d’où, puisque & = 0 est arbitraire, 
4 (4) = he (4). 
On peut montrer que la famille des ensembles mesurables au sens de Lebesgue 
épuise toute la famille des ensembles de o-unicité de la mesure initiale m. 
Soit m une mesure o-additive quelconque dont & est le domaine de déii- 


nition et soit % — ZL (€), le domaine de définition de son prolongement selon 
Lebesgue. Il est aisé de voir que, quel que soit le demi-anneau ©, vérifiant la 


condition 
Ge CA C M, 


on a toujours 
L (@) = L (©). 


$S 4. Fonctions mesurables 


1. Définition et propriétés fondamentales des fonctions mesurables. 
Soient X et Y deux ensembles quelconques et soient ©; et ©y 
deux familles de parties de X et de Ÿ respectivement. La fonction 
abstraite y — f (x), définie sur X et à valeurs dans Ÿ, s’appelle 
(Sx, ©y)-mesurable, si À € Sy entraîne f-! (4) € Gx. 

Par exemple, si l’on prend pour X et Ÿ la droite numérique 
(c.-à-d. si l’on considère des fonctions réelles d’une variable réelle) 
et pour @z% et ©; la famille de tous les sous-ensembles ouverts (ou 
fermés) de R!, la notion de mesurabilité que l’on vient de définir 
se réduit à la notion connue de continuité. En prenant pour ©; et 
Sy la famille des ensembles boréliens, nous aboutirons aux fonc- 
tions dites B-mesurables (ou mesurables au sens de Borel). 

Dans la suite nous nous intéresserons à la notion de mesurabilité 
surtout du point de vue de la théorie de l'intégration. A cet égard, 
une importance particulière est attribuée à la notion de mesurabilité 
pour les fonctions numériques définies sur un ensemble X sur lequel 
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est donnée une mesure o-additive u. Dans ce cas, on prend pour ©. 
la famille G, de tous les ensembles de À mesurables par rapport à 
u et pour ©ÿ la famille de tous les B-ensembles sur la droite. 
Comme toute mesure o-additive peut être prolongée à une o-algèbre, 
il est naturel de supposer dès le début que @, est une o-algèbre. 
Ainsi, dans le cas des fonctions numériques on est amené à définir 
la mesurabilité de la manière suivante. 

Définition 1. Soit X un ensemble dans lequel est donnée 
une mesure o-additive u, définie sur une o-algèbre @,. Une fonction 
réelle f (x) sur X est dite u-mesurable, si pour tout ensemble boré- 
lien À de la droite numérique on a 

f (4)E Guy. 

De manière analogue, une fonction complexe (x), définie sur X, 
est dite u-mesurable, si @7* (4) € ©, pour tout ensemble borélien 
du plan complexe. Il est aisé de vérifier que ceci équivaut à la u-me- 
surabilité de la partie réelle et de la partie imaginaire de cette fonc- 
tion séparément. 

Une fonction numérique donnée sur la droite est dite borélienne 
(ou B-mesurable), si l’image réciproque de tout ensemble borélien 
est un ensemble borélien. 


Théorème 1. Soient X, Y et Z des ensembles arbitraires et 
soient ©Sx, ©y et ©, des familles de parties de X, Ÿ et Z respective- 
ment. Si la fonction y — f (x), définie sur X, est (Gx, Gy)-mesurable 
et la fonction z — g (y), définie sur Y, est (©y, ©,)-mesurable, alors 
la fonction 

z—= px) = 8 (f(x) 
est (Sx, ©)-mesurable. 

Bref: la composée de deux fonctions mesurables est une fonction 
mesurable. 


Démonstration. Si À € ©, en vertu de la (Sy, @z)- 
mesurabilité de la fonction g, on a g ! (A) — B € Gy. A son tour, 
la (Sx, Gy)-mesurabilité de la fonction f implique que f !(B)E€ 
E Gx, c.-à-d. que f 1 (g-1(4)) — 1 (4) € Sx, d'où l’on conclut 
que la fonction æ est (&+, Sz)-mesurable. 

Corollaire. Toute fonction borélienne d'une fonction numé- 
rique u-mesurable est une fonction u-mesurable. En particulier, toute 
jonction continue d'une fonction n-mesurable est une fonction n-mesu- 
rable. 

Dans la suite, lorsqu'il n’y à aucune confusion à craindre, au 
lieu de « u-mesurabilité » nous écrirons simplement « mesurabilité ». 


Théorème 2. Pour qu'une fonction réelle f (x) soit mesurable, 

il faut et il suffit que pour tout réel c l'ensemble {x:f (x) << c} soit 
mesurable. 

18* 
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Démonstration. Il est clair que la condilion est néces- 
saire, car la demi-droite (—o, c) est un ensemble borélien. Pour 
démontrer qu’elle est suffisante, remarquons d’abord que la o-al- 
gèbre, engendrée par la famille Ÿ de toutes les demi-droites (—0o, c), 
coïncide avec la o-algèbre des ensembles boréliens sur la droite. Or, 
en vertu du n°5, $ 5, chap. I, il en résulte que l’image réciproque 
de tout ensemble borélien appartient à la o-algèbre, engendrée par 
les images réciproques des demi-droites appartenant à À, c.-à-d. 
qu'elle est mesurable. 

Cette condition est souvent considérée comme définition de la 
mesurabilité, c.-à-d. une fonction f (x) est dite mesurable, si tous 
les ensembles de la forme {x:f (x) << c} sont mesurables. 

2. Opérations sur les fonctions mesurables. Montrons que la famille 
des fonctions mesurables, définies sur un ensemble quelconque, est 
close par rapport aux opérations arithmétiques. 


Théorème 3. La somme, la différence et le produit de deux 
fonctions mesurables sont des fonctions mesurables. Le rapport de deux 
fonctions mesurables, si le dénominateur ne s'annule pas, est une fonc- 
tion mesurable. 


Démonstration. Démontrons ce théorème par étapes. 
1) Si la fonction f est mesurable, il est évident que les fonctions 
kf et a + f sont aussi mesurables, quelles que soient les constantes k 


et a. 
2) Si les fonctions y et g sont mesurables, alors l’ensemble 


t:f G&) > 8 (@)} 


est aussi mesurable. En effet, 
(af (eo) > 8 (0) = Ù, (if (2) > na N {aie (@) <a) 


où r, parcourt l’ensemble des nombres rationnels, numérotés dans 
n'importe quel ordre. On en déduit que l’ensemble 
&f@)>a—g(x)}= {ri (à) +8(@)>a} 

est mesurable, ce qui signifie que la somme de deux fonctions mesu- 
rables est mesurable. 

3) De 1) et 2) il résulte que la différence f — g est aussi mesu- 
rable. 

4) Le produit de deux fonctions mesurables est mesurable. En 
effet, utilisons l'identité 


fe= TI +e)—(—8)1. 


Le second membre est une fonction mesurable. Ceci résulte de 
1)-3) et du corollaire du théorème 1, selon lequel le carré d’une fonc- 
tion mesurable est une fonction mesurable. 
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5) Si la fonction f (x) est mesurable et f (x) = 0, alors la fonc- 
tion 1 est aussi mesurable. En effet, si c > Ô, alors 


f (x) 
en <e}= {aif(e) > +} U{sf (0 <0}, 
si c << 0, alors 
L<e}={0> (><). 
et si c — 0, alors 
{m7 <e} tt <o 


Chaque fois on obtient au second membre un ensemble mesurable. 
De 4) et 5) on déduit la mesurabilité du rapport 1 () (à condition 


8 (x) 
que g (x) OÙ). 
Ainsi, nous avons montré qu’en appliquant les opérations arith- 
métiques à des fonctions mesurables, on obtient encore des fonc- 


tions mesurables. 

Montrons maintenant que l’ensemble des fonctions mesurables 
est clos non seulement par rapport aux opérations arithmétiques, 
mais aussi par rapport au passage à la limite. 


Théorème 4. La limite d'une suite de fonctions mesurables, 
convergente pour chaque x € X, est une fonction mesurable. 


Démonstration. Soit f, (x) —+ f (x); alors 
{ 
{if(a) <c}= U U N {am <e—+)} . ({) 


En effet, si f (x)  c, il existe k tel que f (x)  c — Z ; pour Æ 
ainsi choisi on peut trouver une valeur de n assez grande pour que 
l'inégalité 


fm (x) << e—+ 


soit vraie pour tous les m > n, ce qui signifie que x appartient au 
second membre de (1). 

Réciproquement, si x appartient au second membre de (1), il 
existe X tel que pour tous les m suffisamment grands 


fm) <e—+, 


de (1) (x) << c, ce qui signifie que x appartient au premier membre 
e (1). 
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Si les fonctions f, (x) sont mesurables, les ensembles 


{aim (n <e— +) 


le sont aussi. Comme la famille des ensembles mesurables est une 
o-algèbre, d’après (1) l’ensemble 

{x:f (x) < c} 
est aussi mesurable, ce qui prouve la mesurabilité de / (x). 

Remarque. D’après ce qui a été dil, on voit que la mesu- 
rabilité d’une fonction ne suppose pas la donnée d’une mesure sur 
les espaces considérés. On doit seulement indiquer les familles des 
ensembles qui seront appelés mesurables. En fail, la notion de 
mesurabilité est employée, en règle générale, pour les fonctions sur 
un espace À avec une mesure bien déterminée, définie sur une o-al- 
gèbre de ses sous-ensembles. C’est précisément cette siluation qu’on 
va considérer plus bas. 

Comme cela a été déjà signalé, toute mesure o-additive, définie 
sur une ©c-algèbre & de parties d’un ensemble X, peut être considérée, 
sans restreindre la généralité, comme complète, c.-à-d. on peut 
supposer que si À est un ensemble mesurable de mesure nulle, alors 
tout sous-ensemble À’ € À est mesurable (et, bien sûr, u (4) = 0). 
Cette condition de complétude de la mesure sera supposée remplie 
partout dans la suite. 

3. Equivalence. Lors de l’étude des fonctions mesurables il est 
souvent possible de négliger leurs valeurs sur un ensemble de mesure 
nulle. À cette occasion on est amené à la définition suivante. 

Définition 2. Deux fonctions jf et g, données sur le même 
ensemble mesurable Æ, sont dites équivalentes (notalion: f — g), si 

un {x:f (x) Æ g (x)} = 0. 

Adoptons la terminologie suivante. Nous dirons qu’une propriété 
quelconque est vraie presque partout dans £, si elle a lieu partout 
dans Æ£, sauf peut être sur un ensemble de points de mesure nulle. 
Ainsi, deux fonctions sont équivalentes, si elles coïncident presque 
partout. 


Théorème 5. Une fonction f (x), définie sur un ensemble 
mesurable E et équivalente sur E à une fonction mesurable g (x), est 
aussi mesurable. 

Démonstration. De la définition de l’équivalence il 
résulte que les ensembles 

{x:f (x) La} et {x:g (x) <a} 
ne diffèrent l’un de l’autre que d'un ensemble de mesure nulle; 


par conséquent (la mesure étant supposée complète), si le deuxième 
est mesurable, le premier l’est aussi. 
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Remarque. Dans l’analyse classique la notion d’équivalen- 
ce des fonctions ne joue pas un rôle important, car là on considère 
principalement des fonctions continues d’une ou plusieurs variables, 
pour lesquelles l’équivalence coïncide avec l’identité. Plus préci- 
sément, si deux fonctions f et g, continues sur un segment Æ, sont 
équivalentes (par rapport à la mesure de Lebesgue), alors elles 
sont identiques. En effet, si f (xo)  g (xo) en un point x,, en vertu 
de la continuité de f et g, il existe un voisinage du point xo, à l’in- 
térieur duquel on a partout f (x) =£ g (x). Comme la mesure d’un 
tel voisinage est positive, deux fonctions continues ne peuvent être 
équivalentes que si elles sont identiques. 

Pour des fonctions mesurables arbitraires l’équivalence n’im- 
plique pas, en général, leur coïncidence. Par exemple, sur la droite 
numérique, la fonction prenant la valeur 1 aux points rationnels 
et la valeur O aux points irrationnels est équivalente à la fonction 
identiquement nulle. 

4. Convergence presque partout. Etant donné que dans beaucoup 
de cas le comportement d’une fonction mesurable sur un ensemble 
de mesure nulle ne nous intéresse pas, il est naturel d'introduire la 
généralisation suivante de la notion habituelle de convergence ponc- 
tuelle. 

Définition 3. On dit qu'une suite {f, (x)} de fonctions 
définies sur un espace mesuré À converge presque partout vers une 
fonction jf (x), si 


Jim fn (2) = (a) (2) 


presque pour tous les x € X (c.-à-d. si l’ensemble des x, pour lesquels 
l’égalité (2) n’a pas lieu, est de mesure nulle). 

Exemple. La suite des fonctions f, (x) — (—x)", définies 
sur le segment [0, 1}, converge pour n — œ vers la fonction f (x) = 
= 0 presque partout (plus précisément, partout, sauf au point 
x = Î). 

Le théorème 4 admet la généralisation suivante. 


Théorème 4’. Si une suite de fonctions mesurables jf, (x) 
converge vers une fonction f (x) presque partout sur X, alors la fonction 
f (x) est aussi mesurable. 


Démonstration. Soit À l’ensemble sur lequel 
Lim fn (æ)= j (x). 
TN — 00 


Par hypothèse, u (X X À) = 0. La fonction f (x) est mesurable 
sur À et, comme sur un ensemble de mesure nulle toute fonction 
est évidemment mesurable, elle est mesurable aussi sur X X À: 
par conséquent, la fonction f (x) est mesurable sur X. 
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Exercice. Soit {f, (x)} une suite de fonctions mesurables convergeant 
presque partout vers une fonction limite f (x). Démontrer que la suite {f, (x)} 
converge presque partout vers g (x) si et seulement si la fonction g (x) est équiva- 
lente à f (x). 


5. Théorème d’Egorov. En 1911, D. Egorov démontra l'important 
théorème suivant qui met en évidence le lien entre les notions de 
convergence presque partout et de convergence uniforme. 


Théorème 6. Soient E un ensemble de mesure finie et 
{fn (x)} une suite de fonctions mesurables, convergeant presque partout 
sur E vers une fonction f (x). Alors pour tout à >> 0 il existe un ensemble 
mesurable E5 © E tel que 

1) u (Es) > u (E) — 6; 

2) sur l’ensemble E% la suite {f, (x)} converge vers f (x) uniformé- 
ment. 


Démonstration. D’après le théorème 4’, la fonction 
f (x) est mesurable. Posons 


am 4. … En 
E® = ON {elfi() f()|<= } 
Pour m et n fixés, EY représente l’ensemble des points x tels que 
1 
Hi (a)—f (a <Z 
pour tous les i > n. Soil 
E"— |} E?. 
n=1 
D'après la définition de Æ*, il est clair que pour mfixé on a 
real c...cEce.……. 


Etant donné qu’une mesure 6-additive est continue, pour tout m 
et tout Ô >> 0 il existe n, (m) tel que 


m nm Ô 
(EN Engm) < 57 : 


Posons 
Es=— N Enotm) 
m—=i 


et montrons que l’ensemble E; ainsi construit vérifie les conditions 
du théorème. 

Démontrons d'abord que sur Æ% la suite {f; (x)} converge uni- 
formément vers f (x). Ceci résulte immédiatement du fait que si 
x € Es, alors pour toutmona 


(a) f(a1< £, si i> no(m). 
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Evaluons maintenant la mesure de l’ensemble EX ÆE5. A cet effet, 
remarquons que pour tout m on a u (E KE) = 0. En effet, si 
to EE ET, il existe des valeurs aussi grandes que l’on veut de à 
pour lesquelles 


PHOBMIOIEE 


c.-à-d. au point x, la suite {f, (x)} ne converge pas vers f (x). Comme, 
par hypothèse, {f, (x)} converge vers f (x) presque partout, on doit 
avoir 

u (EX ET = 0. 
On en déduit que 


pe (EN Era) = L (EN Erin) < re - 


Par conséquent, 


U(EX Es)=u(EX _A, Ençtm)) = L ( U,CŒENX Ençtm))) < 


m 

< YLEX Em) < D À = 6e 
m=Î m—1 

Le théorème est démontré. 

6. Convergence en mesure. 

Définition 4. On dit qu’une suite de fonctions mesurables 
În (&) converge en mesure vers une fonction f (x), si pour tout 6 > 0 
on à 


Jim p {2:| fn (&)—{ (0) 120} = 0. 


Les théorèmes 7 et 8 ci-dessous mettent en évidence le lien entre 
la notion de convergence presque partout et celle de convergence 
en mesure. De même qu’au numéro précédent, la mesure sera sup- 
posée finie. 


Théorème 7. Si une suite de fonctions mesurables {f, (x)} 
converge presque partout vers une fonction f (x), elle converge vers la 
même fonction f (x) en mesure. 


Démonstration. D’après le théorème #4’, la fonction 
limile f (x) est mesurable. Soit À l’ensemble (de mesure nulle), 
sur lequel la suite {f, (x)} ne converge pas vers f (x). Soient, en outre 


En (6) = {x:| fa (x) —1 (x)| 0), 
Rn(5)= Ü En (0). 


M= \ Ra (6). 
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Il est clair que tous ces ensembles sont mesurables. Comme 
R; (6) = R2(6) = ..., 
en vertu de la continuité de la mesure, on a 
h (Ra (6) — a (M), quand n + oo. 
Vérifions maintenant que 
M € A. (3) 

En effet, si xo & À, c.-à-d. si 

Lim fn (ao) = j (co) 


pour 6 >> 0 donné il existe n tel que 
| fn (to) — f (to) | 6 pour k Zn, 


c.-à.-d. zo Ë R, (o), et, à plus forte raison, xo É M. 
Etant donné que u (4) = 0, de (3) il résulte que nu (M) = 0, par 
conséquent, 


u (R, (o)) — 0, quand nr —+ c; 


comme Æ£, (0) & R, (o), le théorème est démontré. 

On vérifie sans peine que la convergence d’une suite de fonctions 
en mesure n’entraîne pas, en général, la convergence presque partout 
de cette suite. En effet, définissons pour chaque entier naturel X 
sur (0, 1] les fonctions 


1, 1, …, 140 
de la manière suivante : 


i— 1 l 
fo ot pour ——<a<—, 
O0 pour les autres x. 


En numérotant ces fonctions les unes après les autres, nous obtien- 
drons une suite qui, comme on le voit aisément, converge en mesure 
vers zéro et pourtant ne converge en aucun point (démontrer cela !). 


Exercice. Soit {f, (r)} une suite de fonctions mesurables convergeant 
en mesure vers une fonction f (x). Démontrer que la suite {f, (x)} convergc en 
mesure vers g (x) si et seulement si la fonction g (x) est équivalente à f (x). 


Bien que l’exemple ci-dessus montre que le théorème 7 ne peut 
pas être inversé en entier, on a tout de même le théorème suivant. 


Théorème 8. Soit {f, (x)} une suite de fonctions mesurables 
convergeant en mesure vers f (x). Alors, de cette suite on peut extraire 
une sous-suite {f, x (x)} convergeant vers f (x) presque partout. 
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Démonstration. Soit €, &>,... une suite de nombres 
positifs tels que 
lim En — 0, 
ñn— 00 
et soit M3, 12, + - .; Mn, - - - une suite de nombres positifs tels que 
la série 
MT MT... 
soit convergentie. Construisons une suite d'indices 
n; T Ho T + 


de la manière suivante: choisissons nr, de façon que 
{| fn (a) — 7 (a) Ze} Cm 


(un tel n,; existe certainement); ensuite choisissons n; > nr; de 
façon que 


D {T:] fne (x) — f(x) |2> 82} <N2. 
Plus généralement, choisissons nr, > n,_, de façon que 
Ut] fn, (x) — f(x) |>ex} nn. 


Montrons que la suite construite converge vers f (x) presque 
partout. En effet, soient 


- Len EIze 0 Re 


Comme 
R,>=R:>...—7R,—>..., 


en vertu de la continuité de la mesure, on au (ii) — u (Q). 


D'autre part, il est clair que u (À; < D nv d’où nu (R;) + 0 


lorsque à — oo, c.-à-d.  (Q) = 0. Il reste à Vérifier que dans tous 
les points de l'ensemble E XQ on a la convergence 


AO IC) 


Soit z9 € £ X Q. Il existe alors is tel que xo À R;,. Cela signifie 
que pour tous les £k > isona 


Lo € {L:| fn, (x) —f(x)| ex}, 
| fn, (o) — f (to) | <' Ex. 


Comme, par hypothèse, e; — 0, on en déduit que 


Lim fn, (0) = f (ao). 


Le théorème est démontré. 


C.-à-d. 
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Théorème de Lusin. Propriété (C). La définition de la fonction mesura- 
ble, formulée au début de ce paragraphe, concerne les fonctions définies sur des 
ensembles arbitraires et, dans le cas général, n’est liée en aucune façon à la 
notion de fonction continue. Cependant, lorsqu'il s’agit des fonctions sur un 
segment, on a l'important théorème suivant, établi en 1913 par N. N. Lusin. 


Théorème 9. Pour qu'une fonction f (x), définie sur un segment [a, b], 
soit mesurable, il faut et il suffit que pour tout & = 0 il existe une fonction @ (x) 
continue sur [a, b] telle que 


u{xf (à) 2 p ()} < e. 


En d’autres termes, une fonction mesurable peut être rendue continue sur 
[a, b], en la modifiant convenablement sur un ensemble de mesure arbitrairement 
petite. Lorsqu'une fonction définie sur un segment peut être rendue continue 
à l’aide d’une telle « petite déformation », on dit qu’elle possède la propriété (C) 
(la terminologie est celle de N. N. Lusin). Comme le montre le théorème de 
Lusin, pour les fonctions de variable numérique la propriété (C) peut être prise 
comme base de la définition même de la mesurabilité. La démonstration du théo- 
rème de Lusin peut être obtenue en utilisant le théorème d'Egorov (faites cette 
démonstration |). 


$ 9. Intégrale de Lebesgue 


La notion d’intégrale de Riemann, connue du cours d’analyse 
élémentaire, n’est applicable que pour des fonctions qui sont conti- 
nues ou qui n'ont pas « trop » de points de discontinuité. Pour les 
fonctions mesurables qui peuvent être discontinues partout où elles 
sont définies (ou, plus généralement, peuvent être définies sur des 
ensembles abstraits, de sorte que pour de telles fonctions la notion 
de continuité n’a tout simplement pas de sens) la construction rie- 
mannienne de l'intégrale s'avère inapplicable. Cependant, pour de 
telles fonctions il existe une autre notion d’intégrale, beaucoup 
plus parfaite et souple, due à H. Lebesgue. 

L'idée principale de la construction de l'intégrale de Lebesgue 
réside dans le fait que les points x sont groupés non selon leur proxi- 
mité sur l’axe x, comme dans le cas de l'intégrale de Riemann, 
mais selon la proximité des valeurs de la fonction en ces points. 
Ceci permet tout de suite d'étendre la notion d’intégrale à une classe 
de fonctions très générale. 

En outre, l'intégrale de Lebesgue est définie exactement de la 
même façon pour des fonctions données sur des espaces mesurés 
arbitraires, tandis que l'intégrale de Riemann est définie d’abord 
pour des fonctions d’une seule variable et étendue ensuite, avec les 
modifications nécessaires, aux fonctions de plusieurs variables. En 
ce qui concerne les fonctions définies sur des espaces mesurés, 
abstraits pour elles l'intégrale de Riemann n’a point de sens. 

Lorsqu'il ne sera pas fait mention explicite du contraire, nous 
considérerons toujours une mesure o-additive complète u, définie 
sur une o-algèbre d’ensembles dont X est l’unité. Tous les ensembles 
A € X seront supposés mesurables et toutes les fonctions f (x) seront 
supposées définies pour x € X et mesurables. 
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Il sera commode de définir l’intégrale de Lebesgue d’abord pour 
les fonctions dites simples et l’étendre ensuite à des fonctions 
essentiellement plus générales. Les n°5 2-4 sont consacrés à la cons- 
truction de l’intégrale de Lebesgue pour le cas où la mesure de l’es- 
pace tout entier est finie. Le cas d’une mesure infinie sera étudié 
au n° o de ce paragraphe. 

1. Fonctions simples. 

Définition 1. Une fonction f (x), définie sur un espace 
mesuré X, s'appelle fonction simple, si elle est mesurable et prend 
des valeurs en nombre fini ou infini-dénombrable. 

La structure des fonctions simples est caractérisée par le théorème 
suivant. 


Théorème 1. Une fonction f (x) qui prend un nombre fini 
ou infini-dénombrable de valeurs 


U1: U2» + Un» ._. 
est mesurable si et seulement si tous Les ensembles 


Àh —= {x:f (x) — Un} 
sont mesurables. 


Démonstration. [Il est clair que la condition est néces- 
saire, car chaque ensemble 4, est l’image réciproque d’un singleton 
{Yn} et tout singleton est un ensemble borélien. La condition est 
aussi suffisante, parce que dans les conditions du théorème l’image 


réciproque / ? (B) de tout ensemble borélien est une réunion {|} 4, 
Une B 
au plus dénombrable d’ensembles mesurables À,, donc un ensemble 


mesurable. 
L'utilisation des fonctions simples dans la construction de l’in- 
tégrale de Lebesgue sera basée sur le théorème suivant. 


Théorème 2. Pour qu'une fonction f (x) soit mesurable, il 
faut et il suffit qu'elle soit la limite d'une suite uniformément conver- 
gente de fonctions simples. 


Démonstration. La condition est suffisante en vertu 
du théorème 4 du paragraphe précédent. Pour démontrer qu’elle 
est nécessaire, considérons une fonction mesurable quelconque f (x) 
et posons jf, (x) — — , Si _ <f (x) < — 1 (où les m sont des 
entiers et les n sont des entiers positifs). Il est clair que les fonc- 


tions 7, (x) sont simples ; la suite {f, (x)} converge uniformément 
1 
vers f (a), car | f () — fa (D 1< 


2. Intégrale de Lebesgue pour les fonctions simples. Nous intro- 
duirons la notion d’intégrale de Lebesgue d’abord pour les fonc- 
tions que nous avons appelées plus haut fonctions simples, c.-à-d. 
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pour les fonctions mesurables dont l’ensemble des valeurs est fini 
ou dénombrable. 
Soit f une fonction simple prenant les valeurs 
Us Yo + + +, Uno + +. ; Vi FÆ ÿYj pour l Æ j, 
et soit À un sous-ensemble mesurable quelconque de X. 
Il est naturel de définir l'intégrale de la fonction / sur l’ensemble 
A par l'égalité 


À f()du= Y vb (An), (1) 
A n 


* 


où 
An = {2x € À, f (x) — Yn}; 


à condition que la série du second membre de (1) soit convergente. 
On est donc conduit à la définition suivante (où, pour des raisons 
que l’on conçoit, la série est supposée a priori absolument conver- 
gente). 

Définition 2. Une fonction simple f est dite intégrable 
ou sommable sur l’ensemble À (par rapport à la mesure u), si la série 
(1) est absolument convergente. Si la fonction f est intégrable, la 
somme de la série (1) s'appelle intégrale de f sur l’ensemble À. 

Dans cette définition on suppose que tous les y, sont distincts. 
Cependant, il est possible de représenter la valeur de l'intégrale 
d’une fonction simple comme une somme de produits de la forme 
Cru (B;), sans exiger que tous les c; soient distincts. Ceci est possible, 
grâce au lemme suivant. 


Lemme. Soit À = |] By, B;N B; = @ pour iZÆj, et soit 
k 


f une fonction qui prend sur chacun des ensembles B, une seule valeur 
Cr ; alors 
| f(x) du= 3 can (Ba) (2) 
A k 


la fonction f étant intégrable sur À si et seulement si la série (2) est abso- 
lument convergente. 


Démonstration. Ilest aisé de voir que chaque ensemble 
An — {rit € À, Î (x) — Yn} 
est la réunion des B, pour lesquels c; — y,. C’est pourquoi 


D Ynh (À =2 Yn D H(B:)=— > Cu (Br). 


ER Un 
Comme la mesure est non négative, on a 


Dianlu(4n)=Zlynl 2 H(B)=21aln (Bi), 


RER 
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ce qui signifie que les séries 
Zumh(An) et Dean (Br) 
n 


sont à la fois absolument convergentes ou divergentes. 
Le lemme est démontré. 


Etablissons maintenant quelques propriétés de l'intégrale de 


Lebesgue des fonctions simples. 


A) Si deux fonctions simples f et g sont intégrables sur À, leur somme 


f + g l'est aussi et 
uG)+etidue (to du+ | 8 (a) du. 


A A A 
En effet, supposons que 
f(x) = f: pour x EF; € A 
el 
g (x) = g; pour x EG; € À, 
de sorte que 


Ji = | f(x) du — 2 fin (Fi), 


A 
Ja = | g(x)du= > gju (G;). 
À j 


Alors, en verlu du lemme précédent, on a 


J= | a+ethd=T D Gi+enn (Fin). 
A À 


Or, 
n(F) = 2H (FING), n(G)= Zu (FIN G5); 


(5) 


(4) 


(5) 


par conséquent, la convergence absolue des séries (3) et (4) implique 


la convergence absolue de la série (5); en outre, 
J — J'\ + Jo, 


B) Si une fonction simple f est intégrable sur À et k est une constante 


arbitraire, la jonction kf est aussi intégrable sur À et 
À kf(æ)du=x À j(x) du. 
A A 


(La vérification est immédiate.) 
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C) Toute fonction simple f, bornée sur un ensemble À, cst intégrable 
sur À et si | f (x) | < M sur À, alors 


| | 7 (x) du 
A 


— Mu (À). 


(La vérification est immédiate). 

3. Définition générale de l’intégrale de Lebesgue sur un ensemble 
de mesure finie. 

Définition 3. Une fonction j est dite intégrable (sommable) 
sur un ensemble À, s’il existe une suite {f, } de fonctions simples, inté- 
grables sur À, convergeant uniformément vers f. La limite 


I=lim | fa (x) du (6) 
n— 00 
A 
s'appelle intégrale de la fonction f sur l'ensemble À et se note 
| j (2) du. 
A 


Cette définition est correcte, si les conditions suivantes sont 
vérifiées : 

1. La limite (6) existe, quelle que soit la suite uniformément 
convergente de fonctions simples, intégrables sur À. 

2. Pour une fonction f donnée, cette limite ne dépend pas du 
choix de la suite {f, }. 

3. Pour les fonctions simples les définitions de l’intégrabilité 
et de l’intégrale coïncident avec celles données au n° 2. 

Toutes ces propriétés sont effectivement vérifiées. 

Pour démontrer la première, il suffit de remarquer que, d’après 
les propriétés A), B) et C) de l’intégrale des fonctions simples, on a 


Uno du— Vin (odul<u(4)supl (fm (ml 
A À x€ 


Pour démontrer la deuxième condition, il faut considérer deux 
suites {f,} et {fn} convergeant vers f. Si la limite (6) prenait pour 
ces deux suites des valeurs différentes, elle n’existerait pas pour la 
suite obtenue en prenant leur réunion, ce qui contredit la première 
condition. Enfin, pour démontrer la troisième condition, il suffit 
de considérer la suite obtenue en faisant f, — f pour tous les n. 

Remarque. On voit que dans la construction de l'intégrale 
de Lebesgue on peut distinguer nettement deux étapes : la première 
c'est la définition proprement dite de l’intégrale (comme somme 
d’une série) pour une classe de fonctions (fonctions simples somma- 
bles) assez simple et en même temps assez vaste ; la deuxième c'est 


Di 


l'extension de cette définition à une classe de fonctions essentielle- 
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ment plus vaste au moyen du passage à la limite. Au fond, la combi- 
naison de ces deux procédés, c.-à-d. d’une définition constructive, 
mais restreinte, et d’un passage à la limite ultérieure, est présente 
dans toute construction d’une intégrale. 

Etablissons les propriétés fondamentales de l'intégrale de Lebes- 
gue. De la définition on déduit immédiatement que: 


I. | L.du= pu (A). (8) 
A 


II. Si f est une fonction intégrable et k une constante arbitraire, 
la fonction kf est aussi intégrable et on a 


À &f(x)du=R | (0) du. (9) 
A A 


Cette propriété s'obtient par passage à la limite de la propriété 
B) de l'intégrale des fonctions simples. 

III. Additivité: si f et g sont des fonctions intégrables, la fonction 
Î + gest aussi intégrable et on a 


fG)+etidu= | (a du+ | 8 (a) du. (10) 
A A A 
La démonstration s'obtient par passage à la limite de la pro- 
priété A) de l'intégrale des fonctions simples. 
IV. Toute fonction f, bornée sur un ensemble À, est intégrable sur À. 
La démonstration s'obtient par passage à la limite de la propriété 


C) de l'intégrale des fonctions simples, en utilisant le théorème 2. 
V. Monotonie: si f (x) > 0, alors 


| f(x)du>0 (41) 
A 


(sous réserve que l'intégrale existe). 

Pour les fonctions simples cette propriété résulte directement 
de la définition. Dans le cas général elle peut être établie, en remar- 
quant que si la fonction f est mesurable et non négative, il existe 
une suite de fonctions simples non négatives convergeant 
vers f (cf. théorème 2). 

De la dernière propriété on déduit immédiatement que si f (x) > 
> g (x), alors 


| fu | g()du (2) 
A 


A 
et, par suite, si m < f(x) <.M pour tous (ou presque tous) les 
z E À, alors 


/ 


mu (4)< | f(x) du< Mu (4). (13) 


D "+ 
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VI. Si u (4) = O, alors | f (x) du = 0. 
À 
VI". Sif(x) — g (x) presque partout, alors 
| f (x) du= | g(x)du, 
A A 


les deux intégrales existant ou non à la fois. 

Ces deux propriétés découlent immédiatement de la définition 
de l'intégrale de Lebesgue. 

VII. Si la fonction œ est intégrable sur À et on a | f (x) | < œ (x) 
presque partout, alors la fonction f est aussi intégrable sur À. 

En effet, si f et @ sont des fonctions simples, en retirant de À un 
certain ensemble de mesure nulle, nous obiiendrons un ensemble 4° 
qui peut être mis sous la forme d’une réunion finie ou dénombrable 
d’ensembles, sur chacun desquels les fonctions f et @ sont constantes : 
f (x) = an, (x) = br, où | an | L b,. Comme la fonction œ est 
intégrable, on peut écrire 


D lanlu(4n)< D ban (4n)= | pr) du= | p(x)du. 
n n A’ A 


Par conséquent, la fonction f est aussi intégrable et on a 


| | fan) =|| f (&) du |= D ant (4) < D; lan |u (An) = 
A A’ n n 


= | 1f(o|au < ( e(x)du. 
A’ A 
Dans le cas général, cette assertion se démontre par passage à la 


limite, en utilisant le théorème 2. 
VIII. Les intégrales 


Li= (f(@dn = |]f()1du (14) 
À À 
existent ou n'existent pas à la fois. 

En effet, d’après la propriété VII, l'existence de l'intégrale 7, 
entraîne l'existence de Z,. 

Dans le cas des fonctions simples, la réciproque découle de la 
définition de l’intégrale ; dans le cas général, elle peut être démon- 
trée par passage à la limite, en utilisant le théorème 2 ; dans ce cas 
on se servira encore de l'inégalité 


[al—1bI<la—bl],. 


4. o-additivité et continuité absolue de l’intégrale de Lebesgue. 
Au numéro précédent nous avons formulé les propriélés de l'inté- 
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orale de Lebesgue sur un ensemble fixé. Maintenant nous établirons 
quelques propriétés de l'intégrale de Lebesgue, en eonsidérant 
l'expression 


F(4) = | (a) du 
À 


comme une fonction d'ensemble, définie sur la famille des ensembles 
mesurables. Etablissons tout d’abord la propriété suivante. 


Théorème 3 Si A—=1|)  4,, où 4;fj A;j = @ pour 
i £ j, alors 
ficdu= > | an (15) 
A n Ah 


l'existence de l'intégrale du premier membre entraîne l'existence des 
intégrales et la convergence absolue de la série du second membre. 


Démonstration. Vérifions d’abord l'affirmation du théo- 
rème pour une fonction simple f, prenant les valeurs 


Vus Yo ee ) Uns-. e 


Soient 
By = {xx € À, f (x) = ya}, 
Bar — {tx € An; f (x) — Ur}: 
Alors 
À f(a) du = D gun (Bn) = D D (Bar) = 
A k k n 


= > D yen (Bar) = D | f(x) du. (16) 
n kR 


n À, 
Comme, sous l’hypothèse d’intégrabilité de la fonction f sur À, la 


série >, yru (B:) est absolument convergente et comme la mesure 
de chaque ensemble est non négative, toutes les autres séries dans 
la suite d’égalités (16) sont aussi absolument convergentes. 

Dans le cas d’une fonction arbitraire f, le fait qu’elle est inté- 
grable sur À implique que pour tout & > 0 il existe une fonction 
simple g, intégrable sur À, vérifiant la condition 


HOEOIES (17) 
Pour gon a 
| eGdu= S | g(x) du, (18) 
A n À 


n 


où g est intégrable sur chacun des ensembles À, et la série (18) est 
absolument convergente. De cette dernière circonstance et de l’éva- 


19% 
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luation (17) il résulte que la fonction f est aussi intégrable sur chacun 
des ensembles À, et que 


DIT fan | 8 (a) du |< 3 eu (Ar) =en (4), 


An An 


| [Go du— | eta)an]<eu(4); 
À À 


compte tenu de (18), on en déduit que la série > | { (x) du est abso- 
n Àh 
lument convergente et que 


| à | j (x) du — | f(x) du |<2eu (4) 
n Àh À 
Puisque & >> 0 est arbitrairement petit, on a 


> | f@du= | f(a)du. 
n À} A 
Corollaire. Si la fonction f est intégrable sur À, elle est 
aussi intégrable sur tout, ensemble mesurable A' & A. 

Nous avons montré que l’intégrabilité de la fonction f sur l’en- 
semble À implique que si À = |) 4, et 4; NN ÀA;j = @ pour i Æ j, 
n 
alors f est intégrable sur chaque À, et l’intégrale sur À est égale 
à la somme des intégrales sur les ensembles 4,. Cette proposition 

admet la réciproque suivante. 
Théorème 4. Si A — {| 4,, A;fN A; = © pour i Æj et 
n 
la série 
DROIT (19) 
ñn Ah 


est convergente, alors la fonction f est intégrable sur À et 


| f(x) au = > | (a) du. 
A n Ah 
Démonstration. Ici, le seul fait nouveau par rapport 
au théorème précédent est l’affirmation que la convergence de la 
série (19) implique l’intégrabilité de f sur À. 
Démontrons le théorème d’abord pour le cas d’une fonction 
simple f prenant les valeurs f;. Posons 


Bi={xxEA,f(x)=fi}, Ani= An(B;; 
alors 


Ù Ani= Bi ct | [f(2)Idu= 3 1filu(Ani). 


An 
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La convergence de la série (19) implique la convergence des séries 
DDR (Ans) = ZT u (Bo). 


La convergence de la dernière série entraîne l’existence de l’in- 
tégrale 


À f(x) du = 3 fu (Bo). 
A à 


Dans le cas général, on approche la fonction f par une fonction 
simple f, de sorte que 
If) —f(G)I<e. (20) 
Alors 


[iF@Idu< | 17(0) 1du-+eu (4) 


An An 


et, comme la série 
2 u (An) = u (4) 


est convergente, de la convergence de la série (19) on déduit la con- 
vergence de la série 


> | IF)ldu, 


n A, 


ce qui signifie, d’après ce qu’on vient de démontrer, que la fonction 
simple f est intégrable sur À. Mais alors, en vertu de l'inégalité (20), 
la fonction initiale f est aussi intégrable sur À. 

Le théorème est démontré. 

Inégalité de Tchébychev. Si px) >0 sur 
A etc> 0, alors 


L{x:xE À, pH><+ | œ(x) du. (21) 
A 
En effet, soit 
A" = {xx € À, (x) > c}. 


Alors 
|etydu= | gta) du+ | pa)du> | p(a)du>en (4). 
À A AX À’ À’ 


Corollaire. Si 


| If (&)1du=0, 
A 


alors f (x) — 0 presque partout. 
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En effet, d’après l'inégalité de Tchébychev, on a 


{ 
n {2:x€A, MOI RES | | f (x)| du —0 
A 
pour tous les n. Par conséquent, 


h{rz€A, f(x) 20}< D p {axe À, |f(a1>+) =0. 
n=1 
Au numéro précédent nous avons montré que l'intégrale de 
Lebesgue de toute fonction f sur un ensemble de mesure nulle est 
égale à 0. 
Cette proposition peut être considérée comme cas limite de 
l'important théorème suivant. 


Théorème 95 (continuité absolue de l'in- 
tégrale de Lebesgue). Si f (x) est une jonction sommable 
sur l’ensemble À, alors pour tout & >> 0 il existe Ô > 0 tel que 


ff auf<e 
pour tout ensemble mesurable e © À tel que u (e) < G. 


Démonstration. Remarquons tout d’abord que le théo- 
rème est évident, lorsque la fonction f est bornée. Soit donc f une 
fonction arbitraire, sommable sur À. Posons 


An = {xx CEA, n<]|f(x)|<n+1} 
et 


N 
By = LU An, Cn=A\Bxy. 


Alors, en vertu du théorème 3, 
fl@idu= > [If@Iau. 
A n=0 A, 


Choisissons V de façon que 


DROIT NICE 
et soit 


£ 
<< 
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Si maintenant pu (e) à, alors 


rome (io Àiroidut | 1F(@odu. 


e e eNBNx NCN 
La première des intégrales figurant ici au second membre est infé- 
rieure ou égale à . (propriété V) ; quant à la deuxième, elle ne dépasse 
pas l'intégrale prise sur l’ensemble C , tout entier et, par suite, est 
aussi inférieure ou égale à _. Par conséquent, on a 


| If()Idn <e. 


e 


Les propriétés de l'intégrale comme fonction d'ensemble, établies 
plus haut, conduisent au résultat suivant. Soit f une fonction non 
négative, sommable sur l’espace X par rapport à la mesure u. Alors 
la fonction 


F(4)= | f(a)du 


A 


est définie pour tous les ensembles mesurables À € X, est non négative 
et o-additive, c.-à-d. vérifie la condition: si À = |) À, et À; N À; — 
n 


— @ pour i-j, alors F (A) = > F(Ah). En d’autres termes, 


l'intégrale d'une fonction non négative, considérée comme fonction 
d'ensemble, jouit de toutes les propriétés d'une mesure o-additive. 
Cette mesure est définie sur la même o-algèbre que la mesure ini- 
tiale u ; elle est liée à u par la condition; si u (4) — 0, on a égale- 
ment F (4) = 0. 

9. Passage à la limite sous le signe de l’intégrale de Lebesgue. 
La question du passage à la limite sous le signe somme ou, ce qui 
revient au même, la question de l'intégration terme à terme d’une 
série convergente, se pose souvent dans de nombreux problèmes. 

Dans les cours d’analyse classique on montre qu’une condition 
suffisante pour qu’un tel passage à la limite soit possible est la 
convergence uniforme de la suite (la série) considérée. 

Nous établirons ici quelques théorèmes sur le passage à la limite 
sous le signe de l’intégrale de Lebesgue qui représentent des géné- 
ralisations à grande portée de théorèmes correspondants de l’analyse 
classique. 


Théorème 6 (de Lebesgue). Soit {f,} une suite de 
fonctions sur À convergeant vers f. Si pour tous les n on a 


[fn @I< p (x), 
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où wo est une jonction intégrable sur À, alors la fonction limite f est 
intégrable sur À et 


fintæ)du— | f(x) du. 


Démonstration. De l'hypothèse du théorème on déduit 
facilement que |f (x) | < æ (x). Mais alors, comme nous l’avons 
remarqué au n° 3 (propriété VII), la fonction j est intégrable sur À. 
Soit & >> 0. D’après le théorème 5 il existe 8 => 0 tel que u (B) < 6 
entraîne 


KIOLESS (22) 
B 


En vertu du théorème d’Egorov, on peut choisir B de façon que 
u (B) << Ô et que la suite {/,} converge uniformément vers f sur 
C = AB. Donc, il existe N tel que pour r > Net x EC on ait 


HOBAOCIS 7 E 


Alors 
| fan (f(x) du 
A À 


= | [f (x) — fn (x)] au+ | f (x) du — | fn (x) du. 


C B B 


Comme |f (x)| < p (x), et | fr (x)| L Hp (x), on en déduit, compte 
tenu de (22), que 


|) au | fn (du ++ e. 


Le théorème est démontré. 
Corollaire. Si |f, (x) | M = const et f, —f, alors 


Jn(o)du— | f(x) du. 
A À. 


Remarque. Comme la valeur de l'intégrale ne dépend pas 
des valeurs que la fonction prend sur un ensemble de mesure nulle, 
dans le théorème 6 il suffit d’exiger que {f,} converge vers f presque 
partout et que chacune des inégalités | f, (x) | < œ (x) soit vérifiée 
également presque partout. 


Théorème 7(de B. Levi). Soit {f,} une suite de fonc- 
tions intégrables sur À telle que 


Ja Gr) fe) Lee K fn @) K-.. 
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et dont les intégrales sont majorées dans leur ensemble par une constante K: 


| fn (x) du <X. 
A 


Alors la suite {f,} admet presque partout sur À une limite (finie) 
f(a)= lim fn (a), (23) 


la fonction j est intégrable sur À et 


[fn Co) du + | (0 du. 
A. A 


Sur l’ensemble (de mesure nulle), où la limite (23) n’existe pas, 
la fonction f peut être définie de façon arbitraire, par exemple, en 
posant sur cet ensemble f (x) — 0. 

Démonstration. Nous allons supposer f, (x) 0, car 
le cas général peut être facilement réduit à cela par passage aux 
tonctions 


Considérons l’ensemble 
Q — {xx € À, fn (x) — oo}. 
Il est aisé de voir que Q = f |} 0), où 
OÙ —{xxE À, fn(x)>>r}. 
En vertu de l'inégalité de Tchébychev (21), on a 


K 
LOP)<E . 


Etant donné que QMeQME...cQMe..., on peut. 
écrire 
, K 
u(U 7) <— 
nr 
comme pour tout r on a l’inclusion 
Se US, 
n 


. Puisque r est arbitraire, on en déduit que 
u (Q) = 0. 


Ceci prouve que la suite monotone {f, (x)} admet presque partout. 
sur À une limite finie f (x). 


il s'ensuit que u (Q) < = 
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Désignons par À, l’ensemble des points x € À pour lesquels 
r—1<Lf(x)<r,r—=1,2,... 
el posons @ (x) — r sur À,.. 
Lorsqu'on aura démontré l’intégrabilité de œ (x) sur À, notre 


théorème deviendra une conséquence immédiate du théorème 6. 
Posons 


BP: —= U À;. 
r—=1 


Etant donné que sur B,; les fonctions ÿ, et j sont bornées et on a 
toujours @ (x) < f (x) + 1, on peut écrire 


{ot du< À (x) du+u(4)= lim | fr (0) du+u (4) <K+u (4). 
Bs Bs Bs 


D'autre part, 


| p(z)du= > ru(4r). 

Bs r—1 
Du fait que ces sommes sont bornées on déduit la convergence de la 
série 


2 ru (Ar) = | p(x) du. 


r==1 À. 


Ainsi, l’intégrabilité de la fonction œ@ sur À est démontrée. Dans le 

théorème démontré, la condition de non-décroissance 

monotone des fonctions f, (x) peut être remplacée, évidemment, 

par la condition de non-croissance monotone. 
Corollaire. Siw, (x) >0et 


S | Yn (x) du < oo, 


n=1 A 
alors la série >, w, (x) est convergente presque partout sur À et 
n=1 
[ (D pt) = D | vit du. 
A n=1 n=1 À 


Théorème8(de Fatou). Si une suite de fonctions mesu- 
rables non négatives {f,} converge vers f presque partout sur À et 


| fn (x) du<K, 


A 
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alors la fonction f est intégrable sur À et 


| f(x) dE. 
A 


Démonstration. Posons 
Pr (T)= inf fr (x); 
kR>n 
les fonctions œ, sont mesurables, car 
{t:@n(x) <'c}= U {r:fa(x) <'c}. 
R>n 


D'autre part, 0 < , (x) < fn (x); c'est pourquoi les fonctions 
A Sont intégrables et on a 


pr(r)du< | În(x)du<K ; 
À À 
enfin, 


P(r) <'PX) K... K'P(r) K... 
et 


presque partout. Donc, en appliquant le théorème précédent à la 
suite {,}, on obtient le résultat annoncé. 

6. Intégrale de Lebesgue sur un ensemble de mesure infinie. Jus- 
qu'ici, en parlant de l'intégrale et de ses propriétés, on supposait 
toujours que les fonctions considérées étaient données sur des ensem- 
bles de mesure finie. Cependant, on est souvent amené à considérer 
des fonctions données sur un ensemble dont la mesure est infinie, 
par exemple, si cet ensemble est une droite, sur laquelle est définie 
la mesure de Lebesgue. C’est pourquoi il est important d'étendre 
la notion d’intégrale à ce cas également. Nous nous bornerons au 
CaS pratiquement le plus important où l’ensemble considéré X 
peut être mis sous la forme d’une réunion dénombrable d’ensembles 
de mesure finie : 


X=UXn u(Xr)< 00. (24) 


Si l’ensemble X, dans lequel est donnée la mesure u peut être 
représenté comme une réunion dénombrable d’ensembles de mesure 
finie, la mesure u sur X s'appelle mesure o-finie (cf. n° 3, $ 3). Par 
exemple, la mesure de Lebesgue sur la droite, sur le plan ou sur un 
espace à z dimensions, est o-finie. Une mesure ne possédant pas la 
propriété d’être o-finie peut être obtenue, par exemple, en attri- 
buant à chaque point de la droite numérique le poids 1. Alors tous 
les sous-ensembles de cette droite peuvent être considérés comme 
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mesurables : les ensembles finis sont de mesure finie, les autres 
étant de mesure infinie. 

Toute suite croissante {X,} de sous-ensembles mesurables d’un 
ensemble X qui satisfait à la condition (24) s'appelle suite exhaustive. 
Introduisons maintenant la définition suivante. 

Définition 4. Une fonction mesurable f, définie sur un 
ensemble X, sur lequel est donnée une mesure o-finie u, est dite 
sommable sur X, si elle est sommable sur chaque sous-ensemble 
mesurable À € X de mesure finie et si pour toute suite exhaustive 
{X,} la limite 


lim | ()du (25) 


O0 
Xn 


existe et ne dépend pas du choix de cette suite. Cette limite s'appelle 
intégrale de f sur l’ensemble X et se note par le symbole 


| f(x) du. 


X 


Il est clair que pour une fonction f, nulle en dehors d’un certain 
ensemble de mesure finie, la définition ci-dessus est équivalente à 
celle donnée au n° 5. 

Remarque. La définition de l'intégrale d’une fonction 
simple, donnée au n° 2, peut être étendue mot à mot au cas où la 
mesure peut être infinie. Certainement, dans ce cas, pour la som- 
mabilité d’une fonction simple on doit supposer que cette fonction 
prend chaque valeur non nulle seulement sur un ensemble de mesure 
finie. La définition de la sommabilité, donnée au n° 3, se trouve en 
relation directe avec l'hypothèse de finitude de la mesure de l’en- 
semble X. En effet, si u (X) — co, la convergence uniforme d’une 
suite de fonctions simples mesurables {p, } n’entraîne pas, en général, 
la convergence de la suite de leurs intégrales (donner un exemple !). 

Les résultats exposés aux n°% 3 et 4 pour le cas d’une mesure 
finie s'étendent, dans les grandes lignes, aux intégrales sur des en- 
sembles de mesure infinie. 

La différence essentielle réside dans le fait que si u (X) — oo, 
les fonctions mesurables et bornées sur X ne sont pas nécessairement 
sommables. En particulier, dans ce cas, aucune constante non nulle 
n’est intégrable sur X. 

Le lecteur vérifiera sans peine que les théorèmes de Lebesgue, 
B. Levi et Fatou restent vrais dans le cas d’une mesure infinie. 

7. Comparaison de l’intégrale de Lebesgue à l’intégrale de Rie- 
mann. On se propose d'étudier le lien entre l’intégrale de Lebesgue 
et celle de Riemann. Nous nous bornerons ici au cas le plus simple 
quand la mesure considérée est celle de Lebesgue sur la droite numé- 
rique. 


$ 5] INTÉGRALE DE LEBESGUE 301 


Théorème 9. Si l'intégrale de Riemann 
b 


1=(R) | j(x)dz 


a 
existe, la fonction f est intégrable sur la, b] au sens de Lebesgue et on a 
f(x)du= 1. 
[a, b] 
Démonstration. Considérons une partition du seg- 
ment [a, b] en 2” parties par les points 


= a+ (b— a) 


et les sommes de Darboux correspondant à cette partilion: 


on 


b—a « 
= > M ne, 
k=—1 


on 
b—a 
On D Mnk; 
k=1 
Où Mr et Mar Sont respectivement la borne supérieure et la borne 
inférieure de la fonction j sur le segment 
Th LL Th. 
D'après la définition de l'intégrale de Riemann, 
[= lim Q, — lim o. 


NN — CO n — 00 


Posons 
fn (x) = Mnx pour tr 1<T Lx», 
fn (x) = Mnr pOur tr 4LT Tr. 
Au point x — b les fonctions f, et jh peuvent être définies de façon 
arbitraire. On vérifie sans peine que 
| fa (x) du = Qh, | fn (x) du = On. 
[a, b] [a, b] 


Comme la suite fn} est non croissante et la suite {f, } est non décrois- 
sante, on a presque partout _ 
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D'après le théorème de B. Levi, 


| f(x) du == lim Q, = 1 = lim ©, — | f (x) du, 


[a, b] [a, b] 


| If@)—j()ldu= | F@—{() du =0. 


fa, b; [a, b] 


Par conséquent, on a presque partout 


F(&) = f() = 0, 
C.-à-d. : 
f () = f(x) = f(x) 


et donc 
f(x) du = TI. 


[a, b] 


Le théorème est démontré. 

Il est facile d'indiquer des exemples de fonctions bornées sur 
un segment quelconque qui soient intégrables au sens de Lebesgue 
et non intégrables au sens de Riemann (par exemple, la fonction 
de Dirichlet, déjà citée, c.-à-d. la fonction sur [0, 1] qui prend la 
valeur 1 pour tout x rationnel et la valeur 0 pour tout x irrationnel). 
Parmi les fonctions non bornées il n’y a aucune qui puisse être intc- 
grable au sens de Riemann, mais il y en a beaucoup qui sont inté- 
grables au sens de Lebesgue. En particulier, toute fonction f (x) > 0, 
dont l'intégrale de Riemann 

b 


| f()dx 
a+e 
existe pour tout & >> 0 et admet une limite finie Z, lorsque & — 0, 
est intégrable sur [a, b] au sens de Lebesgue et on a 
b 
| f(x) du = lim | f(x) dr. 

[a b] E0 0e 

L'intégrale impropre 


b 
lim | f(x) dz, 
ë—0 Le 


dans le cas où 
b 


lim | 
£—0 


[f (x) [dx = 00, 
a+E 
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n'existe pas au sens de Lebesgue, car, d’après la propriété VIII n° 3, 
la sommabilité de la fonction f (x) entraînerait la sommabilité 
de la fonction | f (x) |. Par exemple, l'intégrale 

1 

| L sin dx 

T T 

0 
existe comme intégrale impropre (semi-convergente) de Riemann 
et n'existe pas comme intégrale de Lebesgue. 

Lorsqu'une fonction est considérée sur toute la droite numérique 
(ou sur une demi-droite), l'intégrale de Riemann d’une telle fonc- 
tion ne peut exister qu’en tant qu'intégrale impropre. Là encore, 
si une telle intégrale est absolument convergente, l'intégrale de 
Lebesgue correspondante existe et a la même valeur; si, par contre, 
cette intégrale n’est que semi-convergente, alors la fonction consi- 
dérée n’est pas intégrable au sens de Lebesgue. Par exemple, la 
fonction 

sin z 
x. 


n’est pas intégrable selon Lebesgue sur la droite toute entière, car 


| Sin Z dx = ©. 
Pourtant, l'intégrale impropre 
| Sin æ dx 
T 


— 00 


existe, comme on le sait, et vaut 71. 


$ 6. Produits directs des familles d’ensembles 
et des mesures. Théorème de Fubini 


En analyse un rôle important est joué par les théorèmes sur la 
réduction d’une intégrale double (ou, plus généralement, multiple) 
à des intégrales simples. Dans la théorie des intégrales multiples 
de Lebesgue le résultat fondamental est le théorème de 
Fubini qui sera démontré à la fin de ce paragraphe. Nous établi- 
rons préalablement quelques notions et faits auxiliaires qui présen- 
tent, d’ailleurs, de l’intérêt en eux-mêmes. 

1. Produits des familles d’ensembles. L'ensemble Z des couples 
ordonnés (x, y) avec x € X et y € YŸ s'appelle produit direct des ensem- 
bles X et Ÿ et se note X X Y. De manière analogue, l’ensemble Z 
des suites finies ordonnées (x4, te, . . ., x,) avec xx € X, s'appelle 
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produit direct des ensembles X,, X°,..., X, et se note 
Z2= XiXXoX...X Xn = KN Àz. 


Dans le cas particulier où 


X, = Xo—...— Xh — X, 
l’ensemble Z est la puissance n-ième de l’ensemble X : 
Z = X7. 


Par exemple, l’espace arithmétique à nr dimensions R” est la 
puissance n-ième de la droite numérique R!. Le cube unité J”, c.-à-d. 
l’ensemble des éléments de R'" dont les coordonnées vérifient les 
conditions 


0OLrx L1,k—1,2,...,n, 
est la puissance n-ième du segment unité 11 — [0, 1]. 


Si C1, Oo, - - ., ©A sont des familles de parties des ensembles 
X1, Xo,..., Xn, alors 


R — EX Ga X + + X On 


désigne la famille des parties de l’ensemble X —  X4 qui peuvent 
être mises sous la forme 


À = A,yXA42X...X An 


avec Az € Or. 
Si C1 = Go — ...— ©, — €, alors R est la puissance n-ième 
de la famille G: 


R — ©”. 
Par exemple, la famille des parallélépipèdes de R” est la puissance 
n-ième de la famille des segments de R!. 


Théorème l.SiS,, ©», ...,@, sont des demi-anneaux, alors 
R — R © est aussi un demi-anneau. 


Démonstration. Conformément à la définition du demi- 
anneau, il faut vérifier que si À, BE R, alors AN BER, et si, 
en outre, B € À, alors À = |] Ci, où Ci = B, CN C; = © pour 

i=1 
ijet C; ER (i—1,2,...,n). Bornons-nous au cas n — 2. 
I. Soient À € ©, X Go, B € @1 X 2; cela signifie que 
A = A, X A», À € ©, À: € Go, 
B = B,XB3, Bi € Gi, B2 € Go. 
Alors 
ANB=(4,N B;) x (4:20 Bi), 
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et, puisque 


A, 1 BE Gr, A2 B2E G», 
ANBEG XG2. 


IT. Supposons maintenant qu'on ait, en outre, 
BP, C À, LE C À » ; 


étant donné que ©, et @, sont des demi-anneaux, on a les décompo- 
sitions suivantes : 


On à 


A1= B;Ù B(9 U ... UB), 
A2 = B2U BSD Ù ... UB9. 
Mais alors 
A = Ai X A2 =(B1 X B2)U(B1X BO)U...U(Bi x BO)ÙU 
U(B9 x B2)U (BE X BO)U ... U(B( X BO)UÙ 


U(BP X Bz)U (BE x BE) U ...U(BE X BP). 


Le premier terme de cette décomposition est B, x B> = B 
et tous les termes appartiennent à la famille @, x @. 

Le théorème est démontré. 

Cependant, de l'hypothèse que les familles @, sont des anneaux 
(ou des o-algèbres) il ne résulte pas, en général, que le produit 
mr ©: est un anneau (respectivement, une 6-algébre). 

k 


2. Produits des mesures. Soient @:, ©... . ., ©, des demi-anneaux, 
sur lesquels sont données les mesures 


di (A1), bo (A2), + . +, Un (An), An € On. 


Pour des raisons de simplicité ces mesures seront supposées finies, 
bien que les raisonnements et les résultats qui vont suivre s'étendent 
sans modifications considérables au cas des mesures o-finies (cf., 
par exemple, [21]). 

Sur le demi-anneau 


Nh — xEXx...x Ch (1) 
définissons la mesure 
U — My X Mo X . . . X Un (2) 
par la formule 
u (4) = pu (4) pa (A2) : . : Un (An); (3) 


où 
A = A, XA2X...X Ah. 


Il faut démontrer encore que u (A) est réellement une mesure, c.-à-d. 
que cette fonction d'ensemble est additive. Faisons cela pour n = 2. 


20—0167 
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Soit donnée la décomposition 
À = À, X À> — U B), B® n BŸ — D, si iÆ j, 
k k k 
B9 = BP x BP. 
D'après le lemme 2, $ 5, chap. I, il existe des décompositions 
A= U CT, A U CS 


telles que les ensembles B{*) soient réunions de certains des C{”) 
et les ensembles B(*) soient réunions de certains des C®. Il est 


évident que 


g (4) = qu (41) pa (42) = DD pi (C3?) pa (Ca) (4) 
u(B®)= pi (BŸ) da (B°)= DD pu (CT) po (CS), (5) 


où la somme dans (5) est étendue aux m et n tels que CM € BW, 
C9 € BH et le second membre de l'égalité (4) contient une fois 
et une seule chaque terme figurant aux seconds membres des égali- 


tés (5). Par conséquent, 


u (4)=2 u (Bx), 


ce qu'il fallait démontrer. 
Ainsi, on voit, en particulier, que l’additivité des mesures élé- 
mentaires sur l’espace euclidien à r dimensions résulte de l’additi- 


vité de la mesure linéaire sur la droite. 
La mesure (2), définie sur le demi-anneau (1) au moyen de la 


formule (3) sera appelée produit des mesures lu, . . ., ln. 
Théorème 2. Si les mesures li, Lo, . . ., M, sont o-additives, 

la mesure produit U = 4 X Mo X ... X Un est aussi o-additive. 
Démonstration. Nous nous bornerons au cas n — 2. 

Désignons par À, le prolongement selon Lebesgue de la mesure mu. 


Soit C — Ù Ch, où les ensembles C et C, sont des éléments de la 


n—=1 
famille ©, X ©», c.-à-d. 
— À X BP, À € ©, B € ©», 

Ch — An X B;, Ah € G1, Ph € CG. 
On suppose que les ensembles À et 4,, 4:,... sont contenus dans 
l’espace X. Posons pour x € X 

He (Bn), Si té À,, 

re @) = 10 si zéA 
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Il est aisé de voir que pour zx € Aona 
2 fn () = pe (B). 


C'est pourquoi, en vertu du théorème de B. Levi (théorème 7, $ 5), 
on peut écrire 


D À fn (2) du = À jte (B) du Au (4) a (B) = ps (4) (B). 


n A A 


Or 


À Pn (2) du = pa (Bn) pi (An) = pr (On): 
À 


par conséquent, 


2U(Cn)= 1 (C): 


Si Lu, ..., u Sont des mesures o-additives, données respective- 
ment sur les o-algèbres @,, . . ., ©, leur produit sera, par définition, 
le prolongement de la mesure y X Mo X ... x Un. Il sera noté 
par le symbole 


Hi @ Mo @ ...@ Un OÙ @ Lx 
En particulier, pour 
MM... MH 
on obtient la puissance n-ième de la mesure : 
UN" = @Ur, Ur = H. 
Par exemple, la mesure n-dimensionnelle de Lebesgue u" est la 
puissance n-ième de la mesure linéaire de Lebesgue pu. 

Remarquons que la mesure produit est automatiquement com- 
plète (même si les mesures L4,..., U, ne sont pas complètes). 

3. Expression de la mesure d’un ensemble du plan par l’intégrale 
de la mesure linéaire de ses coupes. Définition géométrique de l’in- 
tégrale de Lebesgue. Soit G un domaine du plan (x, y) limité par les 
verticales x — a, x = b et les courbes y — @ (x), y — % (x). 

Comme on le sait, l’aire du domaine G s'exprime par l'intégrale 

b 
V(G)= | {p()—v(2)} de. 


a 


La différence œ (to) — % (xo) représente la longueur de la coupe 
du domaine G selon la verticale x — x. Le problème est d'étendre 
ce moyen de mesurer les aires au cas des mesures produits arbitraires 

U = Ux © uy. 
20* 
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Dans ce qui suit nous supposerons les mesures u, et u, définies sur 
des o-algèbres, o-additives et satisfaisant à la condition de complétude 
(si BC Aet up (4) = 0, alors B est mesurable) qui, comme on l’a 
déjà indiqué plus haut, est vérifiée pour tout prolongement de 
Lebesgue. 
Posons 
À» — {y:(x, y) € A} (x fixé), 
Ay = {x:(x, y) E A} (y fixé). 
Si X et Ÿ sont des axes numériques (et donc X X Ÿ est un plan), 
alors 4,, est la projection sur l’axe Y de la coupe de l’ensemble À 
selon la droite x — æo. 


Théorème 3. Sous les hypothèses énumérées plus haut, pour 
tout ensemble u-mesurable À on a À) 


u (4) = | Uy (4x) dux = | Lx (Ay) duy- 
X Y 


Démonstration. Il suffit de démontrer l'égalité 


u(4)= | pal) dus, où pa (2) = y (4x), (6) 
X 


car la deuxième partie du théorème est parfaitement analogue à la 
première. Il importe de remarquer que le théorème renferme auto- 
matiquement l'affirmation que pour presque tous les x (au sens de 
la mesure mu.) les ensembles À, sont mesurables pour la mesure u, 
et que la fonction A (x) est mesurable par rapport à la mesure nu. 
Sans cela la formule (6) n’aurait pas de sens. 

La mesure u est le prolongement selon Lebesgue de la mesure 


M = Ux X Uy 
définie sur la famille ©, des ensembles de la forme 
À = À,, X Axo. 


Pour ces ensembles la formule (6) est évidente, car dans ce cas 

(2) = Uy (4x) pour x € À, 

Pa (x)— 0 pour ré4,. 
1) Remarquons que l'intégration sur X se réduit pratiquement à l'intégra- 
tion sur l’ensemble [J 4, X, en dehors duquel la fonction à intégrer est nulle. 


De manière analogue, 


S 6] PRODUITS. THÉORÈME DE FUBINI 309 


On étend sans peine la formule (6) également aux ensembles de 
N (Sm) qui peuvent être représentés par des réunions finies d’ensem- 
bles deux à deux disjoints de @. 

Dans le cas général, la démonstration de l’égalité (6) est fondée 
sur le lemme suivant qui à lui seul présente de l'intérêt pour la 
théorie des prolongements de Lebesgue. 


Lemme. Pour tout ensemble u-mesurable À il existe un ensemble 
B de la forme 


B=fN Br, B1=B=...—B:—>..., 
Bh=— U Bns, BncCBme...cBne..., 


où les ensembles B,, appartiennent à R (@,.), tel que A CB et 
u (4) = nu (B). (7) 
Démonstration. D'après la définition de la mesura- 


bilité, pour tout n donné il est possible de plonger l’ensemble À 
dans un ensemble C, — |J À,,, réunion d’ensembles AÀ,, de ©, 
Tr 


de sorte que 


u (Cr) < u (4) ++. 


n 
Posons B, — f\ Cx et remarquons que les ensembles B, sont 
k—1 


de la forme B, — = Ü Ônsr OÙ Ôns € Om. En posant, enfin, B,r — Ù Ôns 


on obtient une famille d’ensembles B,, possédant les propriétés 
demandées. 

Le lemme est démontré. 

L'égalité (6) s'étend facilement des ensembles B,: € NR (S,) 
aux ensembles B, et B à l’aide du théorème de B. Levi (théorème 
7, $ 5), car 

PBn G)= lim 98,x (x), PB, <PB,, <...; 


Ps(x) = lim PBn (T), PRZ>PBRE>... 


En vertu de la continuité de la mesure, ces égalités sont vraies en 
tout point x. Si u (4) = 0, alors u (B) — 0 et presque partout 


Ps () = Uy (B;) = 0. 
Comme 4, € B,, presque pour tous les x, l’ensemble À, est mesu- 


rable et 
PA (x) — Uy (A x) — 0, 
| Pa (x) dux =0 = pu (4). 
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Donc, pour un ensemble À de mesure nulle la formule (6) est vraie. 
Dans le cas général, on met À sous la forme À — B\C, où, en 
vertu de l’égalité (7), 

u (C) = 0. 


Comme la formule (6) est vraie pour les ensembles B et C, il est aisé 
de voir qu'elle est vraie aussi pour l’ensemble À. La démonstration 
du théorème 3 est ainsi achevée. 

Soient maintenant Ÿ un axe numérique, u, la mesure linéaire 
de Lebesgue et À un ensemble de points (x, y) de la forme 


{(x, y)}x EM, 0<y<f(x)}, (8) 
où M est un ensemble u,-mesurable quelconque et f (x) est une fonc- 
tion intégrable non négative. Dans ce cas 

f (x) pour x EM, 
My (4) — 
0 pour x é M 
et 
n(4)= | f(x) dh. 


M 
Ainsi, nous avons démontré le théorème suivant. 


Théorème 4. L'intégrale de Lebesgue d'une fonction som- 
mable non négative f (x) est égale à la mesure nu — du; X u, de l'en- 
semble À, défini par la relation (8). 

Lorsque X est un axe numérique, M est un segment et f (x) 
est une fonction intégrable au sens de Riemann, ce théorème traduit 
l'interprétation géométrique bien connue de l’intégrale comme aire 
de la figure située au-dessous du graphe de la fonction. 

4, Théorème de Fubini. Considérons le produit U — X X Y x Z; 
si sur À, Ÿ , Z sont données les mesures u,, Lu, du, alors la mesure 


Mu = Lx © py © 
peut être définie comme 
(Ux @ ly) © Me 
ou bien comme 
us ® (hy ® pi). 


Il est aisé de vérifier qu’en réalité ces définitions sont équivalen- 
tes. 

Le théorème suivant est le plus important dans la théorie des 
intégrales multiples. 


Théorèmes(de Fubini). Soient u, et un, deux mesures 
définies sur des o-algèbres, toutes les deux o-additives et complètes, et 
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soit f (x, y) une fonction intégrable pour la mesure 
u = x © uy 
sur un ensemble 
AC X X y. (9) 
Alors À) 
| Ï (x, y) du = | jf, ÿ) dy ) dits = 
À 


X  Ax 


= ({ ( 0 du) dus. (40) 


Y  Ay 


L’énoncé du théorème renferme l'affirmation que les intégrales 
intérieures existent pour presque toutes les valeurs de la variable, 
par rapport à laquelle on prend les intégrales extérieures. 

Démonstration. Effectuons la démonstration d’abord 
pour le cas f (x, y) > 0. À cet effet, considérons le produit 


U= XX» YXx2Z 
dont le troisième facteur est la droite numérique et la mesure produit 


ÀA=Uux © ly SU =U@U, 


où u! est la mesure linéaire de Lebesgue. 
Soit W un sous-ensemble de U, défini par la condition: 


(x, y, 2) E W, 
si 
D'après le théorème 4, on a 
A (W)= | f(x y)du. (41) 
À 
D'autre part, en vertu du théorème 3, 
2(W)= [E(W) dus (12) 
À 


où & = u © u! et W,. désigne l’ensemble des couples (y, z) tels que 
(x, y, z) € W. En outre, d’après le théorème 4, on a encore 


E(Wa)= | f(2 y) du. (13) 


Ax 


1) Cf. note au bas de la page 308. 
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En comparant (11), (12) et (13), on obtient 
fit nan= | (T7 nd) du 
À À Àx 


ce qu'il fallait démontrer. 
Le cas général se réduit au cas précédent à l’aide des égalités : 


Î (æ, y) = f* (&, y) — f(x, y), 
f* (x, y) = | f(x, y) Ie y) 


f (x, y) = | f(x, y) Ie y) | 


Remarque. Comme le montrent les exemples ci-dessous, 
l'existence des intégrales 


(Sam) an et | ([ran)du (14) 
À  Ax Y  Ay 

n'implique, en général, ni les égalités (10), ni l’intégrabilité de la 

fonction f (x, y) sur À. Cependant, si au moins l'une des intégrales 


CTI nd) dus, T (Tr pau) du (45 
X À ÿ 


x Ay 


existe, la fonction f (x, y) est intégrable sur À et on a les égalités (10). 

En effet, supposons, par exemple, que la première des intégra- 
les (15) existe et soit égale à M. La fonction f, (x, y) — min{|f(x,y)|,n} 
est mesurable, bornée et, donc, sommable sur À. D’après le théorème 
de Fubini, 


| fn (z; yan= | ( | fn (x, y) duy) dux < M. (16) 


A X Àx 


Les fonctions f, forment une suite monotone non décroissante qui 
converge presque partout vers |f (x, y) |. D’après le théorème de 
B. Levi, on en déduit, compte tenu de l’inégalité (16), que la fonc- 
tion | f (x, y) | est sommable sur À. Mais alors la fonction f (x, y) 
est aussi sommable et satisfait aux conditions du théorème de Fubi- 
ni. D'où notre assertion. 

Nous avons démontré le théorème de Fubini sous l’hypothèse 
que les mesures u, et u, (donc, u aussi) sont finies. Cependant, le 
ET est vrai aussi dans le cas des mesures 6-finies (cf., par exem- 
ple, 1211). 


Considérons des exemples de fonctions pour lesquelles les intégrales (14) 
existent, mais les égalités (10) n’ont pas lieu. 
1. Soient 
A =[—1,1P 
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et 
GDS EEE 
Alors 
1 
| f(x, y)dr=0 pour y 0 
— 1 
et 


1 
| f(x, y)dy=0 pour z-£ (0. 
—1 


Par conséquent, 
1 


(( Î (x, pas) à = | (| f (a, y) dy) dr —0, 
1 -i _: 


—1 


mais l'intégrale double au sens de Lebesgue sur le carré n'existe pas, car 


4 1 1 2H | 1 
À [rte la ay= [er [12000 ago | EL, 
1-1 ) 0 0 
2. Soient 
A = [0, 1F 
et 
1 1 1 1 
22 pour = KT << Tr : Sn SG : 
f(x, y) — 1 1 


1 1 
—22n+1 pour Sri SE < Gr ; Sn SY LG ? 


O dans les autres cas. 


1 1 
( iG&, y de) dy=0 


» 


On peut montrer que 


et 


1 
(| f (x, y) ay) dx =1. 


CHAPITRE VI 


Intégrale indéfinie de Lebesgue. 
Théorie de la dérivation 


Dans ce chapitre nous considérons l'intégrale de Lebesgue prin- 
cipalement pour des fonctions sur la droite, en supposant que la 
mesure, par rapport à laquelle on prend cette intégrale, est la 
mesure linéaire habituelle de Lebesgue. 

Si f est une fonction sommable, définie sur un espace mesurable 
X, sur lequel est définie une mesure u, l’intégrale 


| f(x) du (3 
A 


existe pour tout ensemble mesurable À € X et, pour f fixée, repré- 
sente une fonction d'ensemble, définie pour tous les ensembles mesu- 
rables À € X. Une telle intégrale s'appelle intégrale indéfinie de 
Lebesgue. En tant qu'espace X on peut prendre, en particulier, un 
segment de la droite numérique. Si, en outre, À est également un 
segment, l'intégrale (+) est une fonction de deux points, extrémités 
du segment À. On supposera, dans ce cas, que la mesure u est celle 
de Lebesgue sur la droite et on écrira dt au lieu de du. En fixant 
l’une des bornes, par exemple, la borne inférieure, on peut étudier 
X 


les propriétés de l'intégrale | Î (ë) dt, prise sur le segment [a, xl], 


(92 

en la considérant comme une fonction de la variable x. Ce problème 
nous amènera à considérer quelques classes importantes de fonctions 
sur la droite. Le problème général de l'étude de l'intégrale de Lebes- 
gue (d’une fonction fixée f) comme fonction d'ensemble fait l’objet 
du $ 5. 

Du cours d'analyse élémentaire on connaît les égalités fondamen- 
tales suivantes qui expriment la relation entre les cpérations de 
dérivation et d'intégration: si ÿ est une fonction continue et F est 


une fonction continâment dérivable, on a 
X 


1) 7 | FE) d=i (x), 


a 


2) F'(t)dt=F(b)—F (a). 


Q a) © 
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Les questions suivantes se posent : l’égalité 1) est-elle vraie pour 
les fonctions sommables au sens de Lebesgue? Quelle est la classe 
(aussi vaste que possible) des fonctions pour lesquelles l'égalité 2) 
a lieu? 

Ces questions sont étudiées dans les paragraphes suivants de ce 
chapitre. 


$ 1. Fonctions monotones. Dérivabilité de l’intégrale 
par rapport à la borne supérieure 


1. Propriétés fondamentales des fonctions monotones. Nous com- 
mencerons l’étude des propriétés de l'intégrale de Lebesgue 
La 
D(x)= | FO di (1) 


a 


comme fonction de sa borne supérieure par la remarque évidente, 
mais importante, suivante : si la fonction f est non négative, alors 
D (x) est une fonction monotone non décroissante. D'autre part, 
toute fonction sommable est différence de deux fonctions sommables 


non négatives : 
f () = f+ () — f- (). (2) 


De ce fait, l’intégrale (1) peut être décomposée en une différence 
de deux fonctions monotones non décroissantes. Par conséquent, 
l'étude de l’intégrale de Lebesgue comme fonction de sa borne supé- 
rieure peut être réduite à l’étude des fonctions monotones du même 
type. Les fonctions monotones (indépendamment de leur provenance) 
possèdent une série de propriétés simples, mais importantes, que 
nous nous proposons d'exposer ici. 

Rappelons d’abord certaines notions. Lorsqu'il ne sera pas fait 
mention expresse du contraire, nous ne considérerons que des fonc- 
tions données sur un segment. 

Une fonction f est dite monotone non décroissante, Si x < 2 


implique 
f (ti) < f (x); 


de manière analogue on définit une fonction monotone non crois- 
sante. 
Soit f une fonction arbitraire sur la droite. La limite !) 


lim f (xo+h) 

Rh—0+ 
(lorsqu'elle existe) s'appelle Zimite à droite de la fonction f au point 
zo et se note f (x, + 0). De façon analogue on définit la limite à 


&) Le symbole h —+ 0 + signifie que k tend vers 0 en restant toujours po- 
sitif. 
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gauche de la fonction f au point x, notée f (xo — 0). L'égalité 
f (to + 0) = f (xo — 0) signifie, évidemment, soit que la fonction 
f est continue au point x,, soit qu’elle a en ce point une discontinuité 
non essentielle. Le point, où toutes ces deux limites existent, mais 
sont inégales, s'appelle point de discontinuité de première espèce; 
la différence f (xo + 0) — f (xo — 0) s'appelle saut de la fonction f 
en ce point. 

Si f (to) = f (xo — 0), la fonction f s'appelle fonction continue 
à gauche au point xo; si f (to) = f (xo + 0), on dit que j est conti- 
nue à droite en ce point. 

On se propose d'établir les propriétés fondamentales des fonc- 
tions monotones. Pour fixer les idées, nous parlerons des fonctions 
monotones non décroissantes, mais il est clair que tout ce qui sera 
dit plus bas s’étend automatiquement aux fonctions monotones non 
croissantes. 

1. Toute fonction f, monotone non décroissante sur la, b], est 
mesurable et bornée, donc sommable. 

En effet, par définition on a 


f (a) < f (x) << f (b) sur la, bl. 
D'autre part, pour toute constante c, l’ensemble 
Ac = {x:f (x) < c} 


est soit un segment, soit un intervalle semi-ouvert (soit un ensemble 
vide). En effet, supposons qu'il existe des points x tels que jf (x) < c, 
et soit d la borne supérieure de ces points. Alors À, représente soit 
le segment [a, d], soit l'intervalle semi-ouvert [a, d). 

2. Une fonction monotone ne peut avoir que des discontinuités 
de première espèce. 

En effet, soit x, un point quelconque de [a, b], et soit æ, — xo, 
OÙ Zn to. Alors la suite {f (x,)} est bornée inférieurement et 
supérieurement (par exemple, par f (a) et f (b)). Par conséquent, 
elle à au moins un point d’accumulation. D'autre part, l'existence 
de plusieurs points d’accumulation pour une telle suite serait, évi- 
demment, en contradiction avec la monotonie de la fonction f. 
Ainsi, f (xo — 0) existe. De manière analogue on établit l'existence 
de f (to + 0). 

Une fonction monotone n’est pas nécessairement continue. Cepen- 
dant, on a la proposition suivante. 

3. L'ensemble des points de discontinuité d’une fonction monotone 
est au plus dénombrable. 

En effet, la somme de tout nombre fini de sauts d’une fonction 
monotone f sur le segment [a, b] ne dépasse pas f (b) — f (a). Par 


conséquent, pour chaque nr le nombre des sauts plus grands que — 
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est fini. En faisant leur somme pour tous les n — 1,2,..., on 
trouve que le nombre total de sauts est fini ou infini-dénombrable. 

Parmi les fonctions monotones les plus simples sont celles que 
l’on appelle fonctions des sauts. Elles peuvent être construites de la 
manière suivante. Supposons que sur le segment [a, b] soit donnée 
une suite finie ou dénombrable de points 


Lys Los ee 3 Tnse.e 


et qu’à chacun d’eux soit associé un nombre positif k, de telle façon 
que > hn << o. Définissons une fonction f sur [a, b], en posant 
ñn 


f(x)= 2 ln. (3) 


Xn<LX 
Il est clair que cette fonction est monotone non décroissante. 
En outre, elle est continue à gauche !) en chaque point, l’ensem- 
ble de ses points de discontinuité n’est autre que {x,} et le saut 

en chaque point x, vaut h, *?). En effet, 

f(æ—0)=limf(x—e)= lim D 
€ 0+ E-0+ XxXn<x—Ee 

et, comme tout x, vérifiant la condition x, << x vérifie également 
la condition x, << x — € pour € >> 0 suffisamment petit, la dernière 


limite est égale à >, h, — f (x). Ainsi, 
Xn< x 


f (x — 0) = (x). 
Si le point x coïncide avec l’un quelconque des points x,, 
par exemple, avec x — Ln alors 


f (tno+0)= lim f(2n-+e) = lim D hn= D ln 
Ee+0+ 


e0+ Xxn <Xn9TE xn <Xno 
€.-à-d. 
f (tn +0) — f (Eng — 0) = no: 


Enfin, sizæxne coïncide avec aucun des points x,, la fonc- 
tion des sauts est continue en ce point (démontrer !). 

Dans la suite, nous entendrons par fonction des sauts toute fonc- 
tion qui peut être obtenue à l’aide de la construction décrite plus 


1) Si la fonction f était définie par la formule 


f(x)= D ln 
Xn<X 
elle serait continue à droite. Dans la suite, sauf s'il y a mention explicite du 
contraire, toutes les fonctions seront supposées continues à gauche. 
2) À condition qu'aucun des points x, ne coïncide avec b, car x, = b n'’inter- 
vient pas dans la somme (3). Pour tenir compte du saut au point b il faut, au 
lieu de [a, b] considérer l'intervalle semi-ouvert [a, b + €), & > 0. 
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haut. Les fonctions des sauts les plus simples sont les fonctions en 
escalier dont les points de discontinuité peuvent être disposés sous 
la forme d’une suite monotone 


LL Le. LEn Le... 


Dans le cas général, une fonction des sauts peut être douée d’une 


structure plus compliquée ; par exemple, si {x,} est l’ensemble des 
| 


points rationnels du segment [a, b] et h, — 5h la formule (3) défi- 
nit une fonction des sauts, discontinue pour x rationnel et continue 
pour x irrationnel. 

Une autre classe de fonctions monotones, en quelque sorte oppo- 
sées aux fonctions des sauts, est constituée par les fonctions conti- 
nues monotones. On a la proposition suivante. 

4. Toute fonction monotone continue à gauche peut être représentée 
de façon unique comme la somme d’une fonction continue monotone 
et d’une fonction des sauts (continue à gauche). 

En effet, soient f une fonction non décroissante continue à gau- 
Che, 24, Zo, . . . ses points de discontinuité et À,, ho, ... ses sauts 
en ces points. Posons 

H(x)= D hn. 
Xn<X 
La différence 
p—i—#H 


est une fonction continue non décroissante. Pour démontrer 
cela, considérons la différence 


px) — p@) = 1 @) — 5 GI — LA (7) — H @)), 


où x’ x”. Le second membre de cette égalité représente la diffé- 
rence entre l'accroissement total de la fonction f sur le segment 
[x”, xl et la somme de ses sauts sur ce segment. Il est clair que cette 
différence est non négative, ce qui prouve que la fonction œ est 
non décroissante. D'autre part, x* étant un point arbitraire, on peut 
écrire 
p(x*—0):=f(x*—0)—H(x*—0)=f(x*—0)— 2, An, 
Xn<X* 
p(a* +0) = f(2* +40) —H (2* +0) = (2 +0) — 2, ln 
n<X 
d’où 
p (x* + 0) — p (x* — 0) = f (x* + 0) — f (x* — 0) — kŸ = 0 


(où h* est le saut de la fonction A au point x*). Il en résulte, compte 
tenu de la continuité à gauche de f et H, que œ est bien une fonction 
continue. 
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2. Dérivabilité d’une fonction monotone. Passons maintenant à 
la question de savoir si toute fonction monotone à une dérivée. 


Théorème 1 (H. Lebesgue). Toute fonction monotone f, 
définie sur un segment la, b], admet presque partout sur ce segment 
une dérivée finie. 

Introduisons tout d’abord certaines notions indispensables pour 
la démonstration de ce théorème. 

Comme on le sait, la dérivée d’une fonction / en un point x 
est, par définition, la limite du rapport 

Ï (x) — f (&o) (4) 
T— To 
quand x —+ x. Cette limite peut, bien sûr, exister ou ne pas exister, 
mais les quatre grandeurs suivantes (qui peuvent prendre des valeurs 
finies ou infinies) ont toujours 
un sens: 

Aa: la limite supérieure 
du rapport (4) quand x tend 
vers Zo à droite (c.-à-d. de 
sorte que x — xo >> 0). Cette 
orandeur s'appelle nombre dé- 
rivé supérieur droit. 

ka (nombre dérivé inférieur 
droit) : la limite inférieure du 
rapport (4) quand x — x à 
droite. 

Ag (nombre dérivé supérieur 
gauche) : la limite supérieure du 
rapport (4) quand x —xo à 
gauche. 

À (nombre dérivé inférieur gauche): la limite inférieure du rap- 
port (4) quand x —- x, à gauche. 

Sur la figure 19 sont indiquées les droites ayant pour coefficients 
angulaires respectivement A4, Aa, À,, À Il est clair qu'on a toujours 


ha & Àa et le <L Âge 


Si Ayet A4 sont finis et égaux, leur valeur commune est la dérivée 
à droite de la fonction f (x) au point +0. De même, si A, = À,, 
leur valeur commune est la dérivée à gauche. L'existence d’une 
dérivée finie de la fonction jf en x, équivaut à ce que tous les nom- 
bres dérivés de la fonction j en ce point sont finis et égaux entre eux. 
C’est pourquoi le théorème de Lebesgue peut être formulé de la façon 
suivante : pour une fonction monotone sur [a, bl les relations 


—00 TZ hg = ha = ÀAÿ = Ag < © 
ont lieu presque partout sur Îa, b]. 


Fig. 19 
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Exercice. Soit f* (x) = — f (x). Quelles relations existent entre les 
nombres dérivés de f* et ceux de f? 

Même question, si l’on passe de f (x) à f (—x). 

La démonstration du théorème de Lebesgue est fondée sur le 
lemme ci-dessous que nous utiliserons encore dans la suite. 

Introduisons la définition suivante. Soit g (x) une fonction con- 
tinue, donnée sur le segment a < x < b. Nous dirons qu’un point 
x, de ce segment est invisible à droite pour la fonction g, s’il existe 
un point E (x0 < E  b) tel que g (xo) << £g (E) (fig. 20). 


Lemme(F.Riesz). Pour toute fonction continue g, l'ensemble 
des points invisibles à droite est ouvert dans La, b] et, par conséquent, 
peut être représenté par une réunion finie ou dénombrable d’intervalles 
ouverts deux à deux disjoints (az, bx) (et, peut être, d'un intervalle 
semi-ouvert contenant l'extrémité a). Pour chacun de ces intervalles on a 


g (ax) < £& (br). (9) 


Démonstration du lemme. Si xo est un point 
invisible à droite pour g, en vertu de la continuité de g, tous les 
points assez voisins de x, jouissent de la même propriété. Par consé- 
quent, l’ensemble des points possédant cette propriété est ouvert 
dans Îa, b]. Soit (a, b;,) l’un des intervalles composants de cet 
ensemble. Supposons que 


g (ax) > £& (dx); (6) 


il existe alors à l’intérieur de cet intervalle un point x, tel que 
£g (to) > £ (b:). Soit x* le plus à droite des points de (a;, b;) pour 
lesquels g (x) = £g (xo). 

Comme x* € (az, br), il existe un point & > x* tel que g (£) >= 
> g(x*). Ce point ne peut pas appartenir à l'intervalle (az, b;), 
parce que x* est Le plus à droite des points de cet intervalle pour les- 
quels g(x) — g(xo), tandis que g(b;) < g(xo). D'autre part, 
l'inégalité & => b, est également impossible, car dans le cas con- 
traire on aurait g (bz)  g (xo)  £ (Ë); or, db, n'est pas un point 
invisible à droite. La contradiction obtenue montre que l'inégalité 
(6) est impossible. Par conséquent, g (a;) < g (b;) et le lemme est 
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démontré. Le lecteur vérifiera sans peine qu’en réalité on a g (ay) — 
— g (b4), pourvu que ax = 4. 

Remarque. Disons qu’un point x, est invisible à gauche 
pour la fonction continue g (x), s’il existe un point £  xo tel que 
£g E) > g(xo). Un raisonnement analogue montre que l’ensemble 
des points invisibles à gauche est une réunion finie ou dénombrable 
d’intervalles deux à deux disjoints (az, b,) et que 


g (ar) > & (dx). 


Passons maintenant à la démonstration du théorème de Lebesgue. 
Effectuons d’abord la démonstration sous l'hypothèse que f est une 
fonction continue non décroissante. À cet effet, il suffit de démontrer 
que presque partout on a: 


1) Aa < oo, 2) y > Aa 


En effet, si l’on pose f* (x) — —f (—x), f* sera une fonction 
monotone non décroissante, définie sur le segment [—b, —al. Si 
Aâ et À£ sont les nombres dérivés, respectivement supérieur droit 
et inférieur gauche, de la fonction f*, alors, comme on le vérifie 
aisément (cf. exercice, p. 320), pour tout x € (a, b)on a 


Ag (a) = Af(—a), ha (0) = M (0). 
Donc, en appliquant l'inégalité 2) à f* (x), on obtient 

ha > Az (7) 
presque partout sur [a, bl. En disposant les inégalités obtenues 


en chaîne et en tenant compte de la définition des nombres dérivés, 
on obtient 


Aa <hg < Ag < ha < Aa; 
ce qui signifie précisément que 
kg = ha = Ag = À. 
Montrons d’abord que A; << © presque partout, Si À4 = co 


en un point xs, pour toute constante C il existe un point E > xo 
tel que 


1 OT Go) > C, 
ËÉ— 20 
c.-à-d. 
Î (6) — f (xo) > CE — 0) 
ou 


Î Œ) — CE f (xo) — Cro- 
Autrement dit, x, est un point invisible à droite pour la fonction 


g (x) = f (a) — Cx. 


21—0167 
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D'après le lemme de F. Riesz, l’ensemble des points possédant cette 
propriété est ouvert et pour chacun de ses intervalles composants 
(ar, bz) on à 

Î (ax) — Car < Ï (0x) — Cr, 
c.-à-d. 

f (0x) — f (ar) > C (br — ax). 


En divisant par C et en faisant la somme des inégalités obtenues 
sur tous les intervalles (a;, b,), on obtient 


S'Gi—a)< 3 DEN HO, 
k R 


Comme la constante C peut être aussi grande que l’on veut, on 
en déduit que l’ensemble des points pour lesquels À; — peut 
être recouvert par une famille d’intervalles dont la somme des lon- 
gueurs est aussi petite que l’on veut. Par conséquent, cet ensemble 
est de mesure nulle. 

La même méthode, liée au lemme de F. Riesz, permet de démon- 
trer que À, > Aa presque partout, mais cette fois elle doit être 
appliquée deux fois. Considérons deux nombres rationnels c et C 
tels que 0Lc<C<œ et posons p — æ Désignons par Æe c 
l’ensemble des x pour lesquels A; > C et À, << c. Lorsqu'on aura 
démontré que U£e, c = 0, il s’ensuivra que À > A4 presque par- 
tout, car il est évident que l’ensemble des points pour lesquels 
kg < Àa est une réunion finie ou dénombrable d’ensembles de la 
forme Eee, C- 

Etablissons maintenant l'inégalité fondamentale. 

Pour tout intervalle (x, B) € La, bl on a 


u (£e,c AN (œ, B)) < p (B — a). 


En effet, considérons d’abord l’ensemble des x € (œ, B) pour les- 
quels À, << c..A tout point x de cet ensemble on peut associer un 
point £ << x tel que 

LEE < 6 où f(E)—c(E) > f(x) — cz. 
Par conséquent, un tel point x est invisible à gauche pour la fonction 
f (x) — cx et, d'après le lemme de F. Riesz (cf. remarque p. 321), 
l’ensemble de tous ces x est une réunion finie ou dénombrable d’inter- 
valles (ax, Br) & (a, B) et f (ax) — car > f (Bx) — chx, c.-à-d. 


Î (Bx) — f (au < C (Br — ax). (8) 


Sur chacun des intervalles (az, B.) considérons l’ensemble G; des 
points x pour lesquels À, > C. En appliquant de nouveau le lemme 


$ 1] FONCTIONS MONOTONES. DÉRIVABILITÉ 323 


de F. Riesz (cette fois, comme dans la démonstration de l'inégalité 
Aa < ©, pour les points invisibles à droite), on peut conclure que 
G, est une réunion finie ou dénombrable d'’intervalles disjoints 
(ans, Bas) et que 


Bas — ans < 1 (Bas) —f (œns)]. (9) 


Il est clair que l’ensemble Æ4 cf («, f) peut être recouvert par 
la famille des intervalles (a;;, B:;); en vertu des inégalités (8) et 
(9), on a 


D (Ba5— on) < 5 DL (Bus) — f (an) < 


k,J k, j 


LT DB) —f (ou) < D (Bu — x) <p(B— 0) 
R 


R 


et l'inégalité fondamentale est donc démontrée. 

Maintenant il est aisé de démontrer que uÆ£4, c = 0. 

Pour cela il suffit d'utiliser seulement la propriété de l’ensemble 
FE c qui est décrite par l'inégalité fondamentale. 


Lemme. Soit sur le segment la, b] un ensemble mesurable À 
tel que pour tout intervalle (ax, B) € [a, bl on a l'inégalité 


(AN (, B)) < p (B — a), 
où O0 <Lp LA. Alors À = 0. 
Démonstration. Soit uA = {. Pour tout e > 0 il existe 
un ensemble ouvert G, réunion dénombrable d’intervalles (a, b»), 


tel que A Get D (b» — am) Lt+e. Posons th =ulAN(an, bm)l. 

Il est clair que t — dt, D'après l'hypothèse du lemme, t, < 

ZE (b» — Am). Par conséquent, 4 p> (b, — am) <o(t+e) 
m 


et, comme € >> 0 est arbitraire, on en déduit que {<< pt. Mais 
0 <'p <'1, c'est pourquoi t = (0. 

Le lemme est démontré et par là même la démonstration du 
théorème 1 est achevée. 

Ainsi, nous avons démontré le théorème 1, en supposant la fonc- 
tion f continue. Les mêmes raisonnements s'étendent également 
au cas d’une fonction monotone discontinue, si l’on utilise la géné- 
ralisation du lemme de F. Riesz aux fonctions ayant des discontinui- 
tés de première espèce. 

Soit g une fonction définie sur le segment [a, b], n'ayant que des 
discontinuités de première espèce. Nous dirons qu'un point x € 
€ La, b] est invisible à droite pour g (x), s’il existe un point Ë > x 
tel que 

max [g (zo — 0), g (to), & (to + 0) << g (E). 
24% 
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Alors, comme dans le cas d’une fonction continue g, l’ensemble des 
points invisibles à droite pour g est ouvert et pour chacun de ses interval- 
les composants (ax, b,) on a 


g (ar) < £& (br). 


Bien que sa démonstration soit très longue, le théorème 1 a un 
sens intuitif assez simple. Expliquons, par exemple, pourquoi le 
nombre A4 (de même que AÀ,) doit être fini presque partout. Le 

Aj 


rapport + représente « le coefficient de dilatation » du segment 


{a, b] au point donné x par l’application f. Comme celte application 
transforme le segment fini [a, b] en un segment fini [f (a), f (b)], 
cette « dilatation » ne peut pas être infinie sur un ensemble de 
mesure positive. 

Il est souvent commode de se servir du théorème suivant sur la 
dérivation terme à terme d’une série de fonctions monotones, appelé 
parfois « petit théorème de Fubini ». 


Théorème 2. Une série partout convergente 


> Fn(x)=F (x), (10) 


où F, sont des fonctions monotones non décroissantes sur La, b], est 
presque partout dérivable terme à terme: 


2 Fr (x)=F'(x). 


Démonstration. Etant donné la possibilité de remplacer 
F, (x) par F, (x) — F, (a), on peut supposer que toutes les fonctions 
F, (x) sont non négatives et s’annulent pour x = 4. 

En vertu du théorème 1, il existe un ensemble £ € [a, b] de 
mesure b — a, sur lequel existent toutes les dérivées F, (x) et F” (x). 
Considérons deux points arbitraires x € E et £ € [a, bl. On a 


S' {Fn (E)—Fn (2)} 
2 _ F()—F() 
E—x E—x ° 


Comme les différences £ — x et F, (&) — F, (x) sont de même signe 
(les fonctions sont monotonesl), pour tout N on a 


N 
. {Fn (E)—Fn (x)} 
2 cFO-FE 
E—x >» E—zx 
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En passant à la limite pour & — x, on obtient 
N 
21 Fr(x) SF (x). 
Etant donné que F, (x) > 0 pour tous les n, on en déduit que 
À Fi(a)<F' (x). (41) 
n—1 


Ainsi, la série des dérivées F, (x) est convergente partout sur £. 
Montrons que presque pour tous les x dans (11) il y a égalité. A cha- 
que * on peut associer une somme partielle S,, (x) de la série (10) 


telle que 
1 


Comme la fonction F (x) — 53, (x) — DS Fm (x) est non décrois- 
m > Un 
Sante, on a 


> 1 
OLF(x)—5S3, (x) < SR 
pour tout x, ce qui implique que la série 


21 LF(x)— 82, (x), (12) 
formée de fonctions non décroissantes, converge (même uniformément) 
partout sur le segment [a, b]. Alors, d’après ce qui précède, la série 


O0 


D LP (a) 85, (x)] (13) 


obtenue de (12) par dérivation terme à terme, est convergente presque 
partout. Donc, le terme général de la série (13) tend vers zéro presque 
partout, c.-à-d. Sa, (x) — F” (x) —- O0 presque partout. Mais si dans 
(11) il y avait inégalité stricte, aucune suite de sommes partielles 
ne pourrait converger vers F” (x). Par conséquent, 


D Fa(a)= F'(x) 


presque partout. 

Le théorème est démontré. 

Corollaire. La fonction des sauts d'une fonction monotone 
a une dérivée nulle presque partout. 
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En effet, une telle fonction est la somme d’une série convergente 
de fonctions non décroissantes de la forme 


F {, pour Xx<Tn, 
n (æ)= fn Pour x > Zn 


dont chacune a une dérivée presque partout nulle. 
3. Dérivée d’une intégrale par rapport à sa borne supérieure. 
Comme l'intégrale 


| pt) di 


de toute fonction sommable est différence de deux fonctions monoto- 
nes, du théorème 1 on déduit immédiatement le résultat suivant. 


Théorème 3. Pour toute fonction sommable ®@, la dérivée 


_ | p(&) dt (14) 


existe presque pour tous les x. 


Il importe de souligner que bien que nous ayons établi l'existence 
presque partout de la dérivée (14), la question concernant l'égalité 


| d= (x) 


a 
n’a pas été abordée. En fait (cf. $ 3), cette égalité est vraie presque 
partout pour toute fonction sommable . 


$ 2. Fonctions à variation bornée 


La question de la dérivabilité de l'intégrale de Lebesgue par 
rapport à sa borne supérieure nous a amené à considérer la classe 
des fonctions qui peuvent être représentées sous la forme des diffé- 
rences de fonctions monotones. Dans ce paragraphe nous donnerons 
une autre description de ces fonctions, sans faire appel à la notion 
de monotonie, et considérerons leurs propriétés fondamentales. 
Commençons par les définitions nécessaires. 

Définition 1. Une fonction f, définie sur le segment [a, bl], 
s'appelle fonction à variation bornée, s’il existe une constante C 
telle que pour toute subdivision du segment [a, b] 


a = LI LL Lee. LEn = bd 


on ail 
n 


À 1F (mn) — 1e < Ce (1) 
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Toute fonction monotone est à variation bornée, car la somme 
figurant au premier membre de l'inégalité (1) pour une telle fonc- 
tion ne dépend pas du choix de la subdivision et vaut toujours 


| f () — f (a) |. 

Définition 2. Soit f une fonction à variation bornée. La 
borne supérieure des sommes (1) pour toutes les subdivisions finies 
possibles du segment [a, b] s'appelle variation totale de la fonction j 


sur le segment [a, b] et se note V® [fl]. Ainsi, 


k 
Vé[f1= sup 2 [f (zx) — (ans) |. 


Remarque. Une fonction jf, définie sur toute la droite numé- 
rique, s'appelle fonction à variation bornée, si les nombres 


Va [fl 
forment un ensemble borné. Dans ce cas la limite 
li b 
pau Va [7] 


s'appelle variation totale de la fonction f sur la droite — 00 << x << 


et se note PV, [f]. 

Considérons les propriétés fondamentales de la variation totale 
d'une fonction. 

1. Pour toute constante à on a 


Valafl=] «| Va (fl. 


Ceci résulte immédiatement de la définition de V2? [fl. 
2. Si f et g sont des fonctions à variation bornée, f + g est aussi 
une fonction à variation bornée et 


Volf+el VS IV fel. (2) 


En effet, pour chaque subdivision du segment [a, b] on a 


2 f(x) + g (ar) —f (trs) — 8 (tr) | < 
<2 | f (ta) —f (xn-1) +2 | g (xx) — g (xx) |, 


d’où, puisqu'on a toujours 
sup (4 + B) < sup À + sup B, 


on obtient l'inégalité annoncée. 

Les propriétés 1 et 2 signifient que toute combinaison linéaire 
de fonctions à variation bornée (définies sur un segment donné [a, b]) 
est aussi une fonction à variation bornée. En d’autres termes, Les 
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fonctions à variation bornée forment un espace vectoriel (à la diffé- 
rence de l’ensemble des fonctions monotones qui n’est pas un espace 
vectoriel). 

3. Sia<<b<e, alors 


Valfi+ Vi (fl = Vi (fl. (3) 


En effet, considérons d’abord une subdivision du segment [a, cl 
telle que b soit l’un des points de subdivision, par exemple, x; = b. 


Alors 
2 | (xx) — f (tr) | = 2 | f(tr) — f (ze) | + 


+ 2 1 —f(rl<VeTI+VEUI (© 


Considérons maintenant une subdivision arbitraire du segment [a, cl]. 
Il est clair que si l’on ajoute à cette subdivision un nouveau point, 
en particulier, le point b, la somme 


D fax) —f(xr-s) | 
k=—1 


ne diminue pas. Par conséquent, l'inégalité (4) est vérifiée pour toute 
subdivision du segment [a, cl, donc 


Val< Vol VE (fl. 


D'autre part, pour tout & >> 0 il existe des subdivisions des seg- 
ments [a, b] et [b, c] telles que 


DIF) (xi-1)| > Val + 
et ° 
DIF GD— (NID VE 


J 


En réunissant ces deux subdivisions, on obtient une nouvelle subdi- 
vision du segment [a, c] pour laquelle 


2:17 Gen) —f (an) = 217 (ai) —f (ri) 
HDI (fi) 1> Valid VE lA —e. 
Comme €e >> 0 est arbitrairement petit, on en déduit que 


Val Valf1+- Vo (f]. (5) 
De (4) et (5) on obtient (3). 
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Comme la variation totale de toute fonction sur tout segment est 
non négative, de la propriété 3 on déduit aussitôt la propriété sui- 
vante : 

4. La fonction 


v (x) = Valf] 


est monotone non décroissante. 

5. Si la fonction f est continue à gauche en un point x*, la fonc- 
tion v est également continue à gauche en ce point. 

En effet, soit donné € > 0. Choisissons ô => 0 de façon que 
| f (x*) — f (x) << , dès que x* — Ô x < x*. Choisissons ensuite 
une subdivision 

A = LL LL eee En = X* 
telle que 


Va 1 [fa — (an) < +. (6) 


k—1 
Sans restreindre la généralité, on peut supposer que 
LF — Xn_y LÔ 
(car sinon, on ajouterait à la subdivision considérée un nouveau 


point, ce qui ne peut que diminuer la différence figurant au premier 
membre de l’inégalité (6)). De ce fait, 


La) — fan) <= 


et, par conséquent, 
n—1 
VE [f] — à | f (tx) — (Xh_1) | << &. 


Mais alors, à plus forte raison, 


Va (I— VE If <e, 
C.-à-d. 
U(T*) — 0 (Tn-1) LE. 


Comme v est une fonction monotone non décroissante, on en déduit 
que v(x*) — v (x) Le pour tous les x tels que 4,4 Kx EL r*. 
Cela signifie précisément que la fonction v est continue à gauche 
en x*. 

Si la fonction f est continue à droite en un point x*, par des raison- 
nements analogues on peut montrer que la fonction v est aussi 
continue à droite en ce point. Par conséquent, si la fonction f est 
continue en un point (ou sur le segment [a, b] tout entier), il en est 
de même de la fonction v. 
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Soit f une fonction quelconque à variation bornée, définie sur 
le segment [a, b], et soit v sa variation totale sur [a, xl. Considérons 
la différence 

p=v—f. 

Cette différence est une fonction monotone non décroissante. En 

effet, soit x’ < x”. Alors 


p 7) — p (7) = Lo (7) — 0 (a) — 1f 7) — f GI (7) 
D'autre part, on a toujours 
Le") — fav (x) — 0 (21) = Vr ff], 


ce qui implique que le second membre de l'égalité (7), donc son 
premier membre également, est non négatif. 
Ainsi, puisque 
Î = VU — ®; 
nous avons obtenu le résultat suivant. 


Théorème 1. Toute fonction à variation bornée est différence 
de deux fonctions monotones non décroissantes. 


La proposition réciproque est évidente : toute fonction qui peut 
être représentée sous la forme d’une différence de deux fonctions 
monotones est à variation bornée. Par conséquent, l’ensemble des 
fonctions représentables sous la forme des différences de fonctions 
monotones, considéré au paragraphe précédent, n’est autre chose 
que l’ensemble des fonctions à variation bornée. 

Du théorème 1 et du théorème de Lebesgue sur la dérivabilité des 
fonctions monotones, établi au paragraphe précédent, on déduit 
immédiatement que {oute fonction à variation bornée a presque par- 
tout une dérivée finie. 

Généralisons maintenant la notion de fonction des sauts. Soit 
Lys Los + + + Tns + - . Un ensemble fini ou dénombrable de points 


« 


de {a, b]. Associons à chacun de ces points deux nombres g, et h, 


de façon que 
D (1gn1+ln|) < 00. 


Supposons, en outre, que si x, = a, on a g, = Oet si x, = b, alors 
n = 
Posons 
Ÿ (x) — D En + > Pin. 
Xn<X Xn<X 
Nous appellerons la fonction ainsi définie fonction des sauts. La 
variation totale de cette fonction est égale à 


Z(I&n 14 ln Da 
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Elle a comme points de discontinuité seulement les x,, pour les- 
quels l’un des nombres g, et h, est différent de zéro; dans ce cas 


Ÿ (Zn) — Ÿ (Ta — 0) —= En) 
Ÿ (tn + 0) — Ÿ (Zn) — Rin. 


On a la proposition suivante : 
Toute fonction f à variation bornée sur la, b] peut s’écrire de façon 
unique sous la forme 
f=@p +, 


où œo est une fonction continue et 1 est la fonction des sauts. 
La démonstration est analogue à celle de la propriété 4 des fonc- 
tions monotones (n° 1, $ 1). Pour construire la fonction Ÿ on posera 


En = Î (Zn) — f (tn — 0), 
Rin = f (tn + 0) — f (zh) 


aux points de discontinuité de la fonction f. 


Exercices. 4. Sifasur [a, b] une dérivée bornée (c.-à-d. si f” (x) 
existe partout et |f’ (x) | < C), alors f est une fonction à variation bornée et 


ValfI<C(b— a). 


2. Soit f(x) — x sin —. Montrer que la variation totale de f sur [0, 1] est 
infinie. 
Seules les constantes sont des fonctions dont la variation totale 
est nulle. Posons 
F1 = Va tr. (8) 
La quantité V? [fl satisfait aux axiomes 2) et 3) de la norme (cf. 
page 134), mais ne satisfait pas à l’axiome 41). Cependant, si l’on 
ne considère que les fonctions vérifiant la condition supplémentaire 
f (a) — 0, elles forment également un espace vectoriel et dans ce 
cas la quantité V2 [fl satisfait à tous les axiomes de la norme. L'’es- 
pace V0 [a, b] des fonctions à variation bornée vérifiant la condition 
f (a) = 0, muni des opérations habituelles d’addition et de multi- 
plication par un nombre, ainsi que de la norme (8), s’appelle espace 
des fonctions à variation bornée. (Démontrer que cet espace est com- 
plet.) 


$ 3. Dérivée de l’intégrale indéfinie de Lebesgue 


Au $ { nous avons montré que l'intégrale de Lebesgue 
X 
| f(t) dt 
a 
comme fonction de x a presque partout une dérivée finie. Cependant, 
nous n’avons pas encore établi la relation entre cette dérivée et la 
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fonction figurant sous le signe somme. Nous établirons maintenant le 
résultat suivant, mentionné déjà à la fin du $ 1. 


Théorème 1. Pour toute fonction sommable f on a presque 
partout l'égalité suivante : 


| Of (a. 


u 


Démonstration. Posons 
D(x)= | f (6) dt. 
Montrons d’abord que 
f (x) Z ®” ) 


presque partout. En effet, si f (x)  ®” (x), il existe deux nombres 
rationnels « et B tels que 


f(x) <a <B< D (x). (1) 


Désignons par £,£8 l’ensemble des points x pour lesquels a lieu l’iné- 
galité (1). Cet ensemble est mesurable, parce que les fonctions } 
et D” sont mesurables. Montrons que la mesure de chacun des en- 
sembles £,, est nulle. Comme ces ensembles sont en infinité dénom- 
brable, il s’ensuivra que 


u {x: f (6) < D (a)} = 0. 
Soit € >> 0 arbitraire, et soit Ô > 0 tel que 


Ifsodl<e, 


dès que u (e) << Ô (un tel 6 existe pour tout € en vertu de la conti- 
nuité absolue de l'intégrale). Choisissons maintenant un ensemble 
ouvert G © [a, b] tel que 


GE et u(G) <U(Eus)+0. 
Six € E,p, alors 


: (2) 


pour tous les Ë = x suffisamment voisins de x. En recopiant l’iné- 
galité (2) sous la forme 


D (E) — BE D (x) — Pr, 


on remarque que x est un point invisible à droite pour la fonction 
D (x) — fx sur chacun des intervalles composants de l’ensemble G. 
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Par conséquent, en utilisant le lemme de F. Riesz, on peut indiquer 
un ensemble ouvert S$ — Ù (ax, bn) tel que E,g ES CGet 


®D (0x) — pb, > > ® (ax) — Par, 
®D (0x) — D (ar) > B (db: — a), 


C.-à-d. 


ou 


or 
| d> Bb: —œ). 
Ch 


En faisant la somme de telles inégalités pour tous les intervalles 
(az, b,) Composant S, on obtient 


| O4 > (S). (8) 
S 
D'autre part, 


[io | f(t) dt + L' f(t)dt< 
S E,, SE # 
(Eas)+e<ap(S)+e+ia|ô. (4) 


En comparant (3 '° t (4), on bent 


u (S) + e + al > fu (S), 


d’où 


et|aælô 
n(S)<- B—a ‘ 

Ainsi, l’ensemble £,, peut être enfermé dans un ensemble ou- 
vert de mesure arbitrairement petite (nous pouvons supposer. par 
exemple, que [a [Ô < €), ce qui signifie que u (E4y) = 0. Par là 
même nous avons démontré que 


f (x) > D” (x) 
presque partout. En remplaçant f (x) par —f (x), on peut montrer de 
la même façon que presque partout on a 


c.-à-d. 
| f (x)< P” (x). 
Par conséquent, 


F(=D (= + | 5 (0 di 


presque partout. 
Le théorème est démontré. 


334 INTÉGRALE INDÉFINIE DE LEBESGUE. DÉRIVATION [Ch. VI 


$ 4. Recherche d’une fonction connaissant sa dérivée. 
Fonctions absolument continues 


Ainsi, nous avons répondu à la première des deux questions 
posées au début de ce chapitre, en établissant que l'égalité 


7 |/O&=ji(e) 


est vraie presque partout pour toute fonction jf sommable sur [a, b]. 
Considérons maintenant la seconde de ces deux questions, c.-à-d. 
cherchons comment peut être généralisée au cas de l'intégrale de 
Lebesgue la formule de Newton-Leibniz 


F(æ)=F(a)+ | F'( dt, (1) 


a 


bien connue de l’analyse élémentaire pour les fonctions continûment 
dérivables. 

Il est naturel de se borner à des fonctions F manifestement déri- 
vables presque partout (autrement, l'égalité (1) n’a pas de sens). 
Comme on le sait déjà, telles sont, en particulier, les fonctions à 
variation bornée. 

D'autre part, l'intégrale figurant au second membre de l'égalité 
(1) est une fonction à variation bornée. Pour cette raison, l'égalité (1) 
ne peut pas être vraie pour une classe de fonctions plus vaste. Etant 
donné que toute fonction à variation bornée est différence de deux 
fonctions monotones non décroissantes, ce sont précisément les 
fonctions monotones qu'il faut étudier en premier lieu. 

Mais pour des fonctions monotones arbitraires l'égalité (1) n’est 
pas, en général, vraie. Cependant, on a le théorème suivant. 


Théorème 1. La dérivée f” d'une fonction monotone non dé- 
croissante f est sommable et 
b 


| f'(a)dr<i(b)—1 (0). 


a 


Démonstration. Par définition, la dérivée de la fonc- 
tion f au point x est la limite du rapport !) 
h) — 
pr (x)= EL TE) (2) 


1) Pour que l'expression f (x + h) ait un sens pour tout x € [a, b], on peut 
supposer que f (x) —f(b) pour x > b et f (x) — f (a) pour x < a. 
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quand k — 0. La monotonie de f entraîne sa sommabilité, donc la 
sommabilité de chacune des fonctions 1. Par suite, l'égalité (2) 
peut être intégrée membre à membre. On obtient 


b b b 
| Pa (x) da = + | f(a+h) de | f(x) dr = 


° ' ' b+h ah 
= | (da | f(x) dx. 


a 


Le second membre de cette égalité tend vers f (b) — f (a + 0), 
quand k — + 0. Donc, en appliquant le théorème de Fatou, on 
obtient 


b b 
À FC) daim | qu (x) de = 5 (b)—f(a+0)<f b)—/ (a) 


(l'existence de l'intégrale de f” est assurée également par le théorème 
de Fatou). 

Le théorème est démontré. 

Il est facile de donner un exemple de fonction monotone pour 
laquelle on ait l'inégalité stricte 


b 


| f'(a)dx < f(b)—f (a). 


(#1 


Il suffit de poser 


| 0 pour 0Lr<T, 
— \ 


f (x) | 
E: pour 7 <i<f. 


Il est intéressant de remarquer qu'il y a des fonctions conti- 
nues monotones pour lesquelles l'inégalité stricte 


| rat < j(x)—f(o 


a lieu pour tous les x >> a. En voici un exemple simple. Considérons 
sur le segment [0, 1] l’ensemble triadique de Cantor et définissons / 
d’abord sur ses intervalles contigus, en posant 


fO= ET, k=1, 2,3, ..., 20 
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sur le k-ième intervalle contigu de rang n (y compris ses extrémités), 
les intervalles étant numérotés de gauche à droite. Alors 


_4 Le 2 
fG)=+ pour z << + ; 
1 1 2 
fG)=—7 pour << ; 
3 7 8 
fÜt)=T pou +<i<T 


et ainsi de suite (fig. 21). De cette façon, la fonction f se trouve défi- 
nie partout sur le segment [0, 1], excepté les points de deuxième 
espèce de l’ensemble de Cantor (c.-à-d. les points n’appartenant ni 
aux intervalles contigus, ni à leurs extrémités). Définissons main- 
tenant f dans les points restés de la manière suivante. Soit £* l’un 
de ces points, et soit {{,} une suite croissante de points de première 
espèce de l’ensemble triadique 
de Cantor (c.-à-d. d’extrémités 
des intervalles contigus) conver- 
geant vers é*. Alors la limite 


lim j (£n) (3) 


nn — 00 


existe. Il en est de même de la 


limite 

lim f (tn), (4) 

> 00 
où {#,} est une suite décroissante 
de points de première espèce con- 
Fig. 21 vergeant vers {* ; de plus, les limi- 
tes (3) et (4) sont égales. En pre- 
nant leur valeur commune pour f (t*), nous obtiendrons une fonc- 
tion monotone, définie et continue partout sur le segment [0, 1], 
appelée « escalier de Cantor ». Sa dérivée est, évidemment, égale à 
zéro en tout point appartenant à un intervalle contigu quelconque, 
c.-à-d. presque partout. Par conséquent, pour cette fonction on a 


+ 2 
3 3 


0= | f'(D dt < f(2)—f(0) = f(x), 
0 


quel que soit x € (0, 11. 
Notons, entre autres, que dans le cas d’une fonction monotone 
Î (x) l'égalité 
b 
| 'Odt=f@)—5 (0 


a 
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entraîne 
x 


| f'O&=f(a)—f (0 


a 


pour tout x € (a, bl. 
Afin de décrire la classe des fonctions pour lesquelles a lieu l’éga- 
lité 
b 
| 'Odt=f@)—1 (a), 


a 


introduisons la définition suivante. 

Définition. Une fonction f, donnée sur un segment [a, bl, 
est dite absolument continue sur La, b], si pour tout e > 0 il existe 
8 > 0 tel que pour toute famille finie d’intervalles deux à deux 
disjoints 

(ar Ds), k — 1, 2; sn 


dont la somme des longueurs est inférieure à 6, 


à (Or — ar) < 6, 
on a l'inégalité 
2 FO) (al <e. 


Il est clair que toute fonction absolument continue est uniformé- 
ment continue. La réciproque est, en général, fausse : par exemple, 
« l'escalier de Cantor », décrit plus haut, est une fonction continue 
(donc, uniformément continue) sur le segment [0, 1], mais elle n’est 
pas absolument continue. En effet, l’ensemble de Cantor peut être 
recouvert par une famille finie d’intervalles (a;, b4), k — 1, 2, ... 

., n, dont la somme des longueurs est aussi petite que l’on veut. 
Toutefois, pour une telle famille d’intervalles on a, évidemment, 
l'égalité 


D |f x) —f (ax)|—=1: 
k=1 


Indiquons les propriétés fondamentales des fonctions absolu- 
ment continues. 

1. Notons tout d’abord que dans la définition 1 ci-dessus au 
lieu de toute famille finie d'intervalles dont la somme des lon- 
gueurs est inférieure à Ô on peut considérer toute famille finie 
ou dénombrable d’intervalles dont la somme des longueurs 
est inférieure à Ô. En effet, supposons que pour e >> O donné on ait 


22=0167 
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choisi Ô > 0 de façon que 
D f(x) —f (ar) <'E 


pour loute famille finie d’intervalles (a,, b,) vérifiant la condition 


n 


Y (bx — x) < Ô, 
R=—1 


et soit (4x, Bx) une famille dénombrable d’intervalles dont la somme 
des longueurs ne dépasse pas Ôô. Alors, pour tout n on a 


D 1 F(Bx)—f ()| <e: 


en passant dans cette inégalité à la limite pour ñr — , on oblient 


2 1F(Bx)—f (a) 1<e- 
) 


2. Toute fonction absolument continue est à variation bornée. 

En effet, la continuité absolue d’une fonction f sur un segment 
[a, b] signifie, en particulier, que pour tout & >> 0 on peut choisir 
Ô >> 0 de façon que la variation totale de j sur tout segment de lon- 
gueur inférieure à Ô ne dépasse pas &. Comme le segment [a, b] peut 
être partagé en un nombre fini de segments de longueur inférieure 
à Ô, la variation totale de f sur La, b] est finie. 

3. La somme de deux fonctions absolument continues et le produit 
d'une telle fonction par un nombre sont des fonctions absolument con- 
linues. 

Ceci résulte immédiatement de la définition de la continuité 
absolue et des propriétés du module de la somme et du produit. 

Les propriétés 2 et 3 signifient que dans l’espace des fonctions à 
variation bornée les fonctions absolument continues forment une variété 
linéaire. 

4. Toute fonction absolument continue est différence de deux fonc- 
tions absolument continues non décroissantes. 

En effet, une fonction absolument continue, comme toute fonc- 
tion à variation bornée, peut être représentée sous la forme 

\ Î = UV — &' 


ou 


v(x)=Valfl et g(x)=v(x)— f(x) 


sont des fonctions non décroissantes. Montrons que chacune de ces 
deux fonctions est absolument continue. Vérifions cela pour v. Etant 
donné un réel & > 0, choisissons ê > 0 comme l’exige la continuité 
absolue de la fonction f. Prenons une famille de nr intervalles (a;, b3) 
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dont la somme des longueurs soit inférieure à ô et considérons la 
somme 


À ( )—v (a): Q 


Cette somme représente la borne supérieure de l’ensemble des va- 


leurs de la somme 
n Mk 


> 2 [f(tx, 2) — f (2x, 1-4) | (6) 


Rh=—1 1 


pour toutes les subdivisions finies possibles 


= L,0 <l,1L T2 eee Ty, m3 = Us 
A2 = Lo,0 L Lo, La,2 LC... Lo, mo = Vs, 


An = Ln,0 L'En,1 LTn,2 eee C'En, mn = Ün 


des intervalles (a,, b,), . . ., (ar, b,). Comme la somme des lon- 
gueurs des intervalles (xx, 7-1, Xe, :) auxquels s'étend la somme (6) ne 
dépasse pas Ô >> 0, toutes les valeurs de la somme (6) sont inférieures 
ou égales à e. Par conséquent, la somme (5), qui est la borne supé- 
rieure de l’ensemble de ces valeurs, est aussi inférieure ou égale à &. 

Les deux théorèmes suivants établissent un lien étroit entre la 
notion de continuité absolue et l'intégrale indéfinie de Lebesgue. 


Théorème 2. Si f est une fonction sommable, l'intégrale 
indéfinie 


F(2)= | 


est une fonction absolument continue. 


Démonstration. Si {(a:, b,)} est une famille quelconque 
d'intervalles deux à deux disjoints, alors 


n DR 


DIF) (a)1= D |T FO &< 
Rh=1 Rk=1 a} 
n 0k 
<> |@ld= | 1@1. 
k=—1 ap Ü (aps bp) 


En vertu de la continuité absolue de l’intégrale de Lebesgue, la 
dernière expression tend vers zéro, lorsque la longueur totale des 
intervalles (a, b;) tend vers zéro. 


22% 
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Théorème 3 (Lebesgue). La dérivée f — F' d'une fonc- 
tion absolument continue, donnée sur un segment la, bl, est sommable 
sur ce segment et pour tout x (a<x<b) on a 


| @)di=F (x)—F (a). 


a 


Les théorèmes 2 et 3 montrent que les fonctions absolument con- 
tinues, et celles-ci seulement, peuvent être rétablies à un terme cons- 
tant près à partir de leurs dérivées au moyen de l’opération d’inté- 
gration. 

Pour la démonstration du théorème 3 nous aurons besoin du lem- 
me suivant. 


Lemme. Si la dérivée d'une fonction absolument continue non 
décroissante f est nulle presque partout, cette fonction est une constante. 


Démonstration du lemme. Comme la fonction f 
est continue et monotone, son domaine des valeurs est le segment 
[f (a), f (b)]. Montrons que la longueur de ce segment est égale à 
zéro, si f (x) — O presque partout. Par là même le lemme sera dé- 
montré. Partageons l’ensemble des points du segment la, b] en 
deux parties : l’ensemble Æ£ des points où f” (x) — 0 et son complé- 
mentaire Z. Par l'hypothèse du lemme, u (Z) — 0. Choisissons un 
réel quelconque £& >> 0 et associons-lui un réel 8 > 0 en accord avec 
la continuité absolue de la fonction f. Enfermons l’ensemble Z dans 
un ensemble ouvert de mesure inférieure à Ô (cela est possible, parce 
que u (Z) = 0). En d’autres termes, on recouvre Z par une famille 
finie ou dénombrable d’intervalles (a;,, b;,) dont la somme des lon- 
gueurs est inférieure à 0. Conformément au choix de 6, on a 


DS (1) —f(a)1<e- 


Par conséquent, la famille des intervalles (a, b;) (et, à plus forte 
raison, l’ensemble Z, contenu dans leur réunion) se trouve transfor- 
mée par la fonction f en un ensemble dont la mesure est inférieure 
à e. Ainsi, pu (f (Z)) = 0. 
Considérons maintenant l’ensemble E — [a, b]\XZ. Soit x € E. 
Alors, puisque f’ (xo) — 0, pour tous les x assez voisins de x, on a 
f (x) —f (xo) < €, 


T—T 
c.-à-d. (pour fixer les idées, on suppose que x > x) 
f (x) — f (ro) < € (x — x) 


ou 
exo — f (to) < Ex — f (x); 
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cela signifie que x, est un point invisible à droite pour la fonction 
g (x) — ex — f (x). Par conséquent, en vertu du lemme de F. Riesz, 
l’ensemble Æ est contenu dans une famille finie ou dénombrable 
d’intervalles (4x, B:) dont les extrémités vérifient la condition 


Er — f (Pr) > Eat — f (ax), 
Î (Br) — f (an) < € (Ba — x), 


D (F(B)—f (au)) 8 (Ba — a) & € (b— 0) 


Autrement dit, l’ensemble Æ est transformé par la fonction f en un 
ensemble qui peut être recouvert par une famille d’intervalles dont 
la somme des longueurs est inférieure à € (b — a). Comme € peut 
être arbitrairement petit, on en déduit que u (f (Æ)) — 0. 

Ainsi, les ensembles f (£) et f (Z) sont de mesure nulle. Or, leur 
réunion donne justement le segment [f (a), f (b)]. Donc, la longueur 
de ce segment est nulle, ce qui prouve que f (x) — const. 

Maintenant il est facile de démontrer le théorème 3. Il suffit de 
se borner au cas où F (x) est une fonction non décroissante. Dans 
ce cas 


c.-à-d. 


d’où 


D(a)=F(x)— | f (6 à (7) 


est également une fonction monotone non décroissante. En effet, 
siz" >zx,ona 


D(x)—D(x')=F(x")—F(x)— | (hd >0. 


D'autre part, la fonction ® est absolument continue (comme diffé- 
rence de deux fonctions absolument continues) et ®” (x) = 0 pres- 
que partout (en vertu du théorème 1, $ 3). Donc, d’après le lemme 
ci-dessus, ® est une constante. En faisant x — a dans (7), on obtient 
que cette constante est égale à F (a). 

Le théorème est démontré. 

Nous avons vu plus haut que toute fonction à variation bornée f 
est somme d'une fonction des sauts Æ et d’une fonction continue 
à variation bornée : 


= H +. 


Considérons maintenant une fonction continue, mais non absolu- 
ment continue, à variation bornée œ et posons 


Ÿ (x) — | g’( dt. 
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La différence 
x = P—Ÿ 
est une fonction continue à variation bornée et 
d d F 
HA) (a) | o (0 &=0 
a 
presque partout. 
Nous dirons qu'une fonction continue à variation bornée est 
singulière, si sa dérivée est nulle presque partout. On peut maintenant 


énoncer le résultat suivant : 
toute fonction à variation bornée peut être décomposée en une somme 


de trois fonctions 


où H est une fonction des sauts, 1 est absolument continue et y est sin- 
gulière. 

Il est aisé de montrer que chaque terme de la décomposition (8) 
est défini par la fonction f de façon unique à une constante additive 
près. Si, en outre, toutes les fonctions figurant dans l’égalité (8) sont 
normées de façon que chacune d'elles s’annule au point x = 4, 
alors la décomposilion (8) est strictement unique. En dérivant les 
deux membres de (8), on obtient que 


jf (x) = Ÿ" G) 


presque partout (car H” et y's’annulent presque partout). Par con- 
séquent, en intégrant la dérivée d’une fonction à variation bornée, 
ce n’est pas la fonction même qu’on rétablil, mais seulement sa 
composante absolument continue. En ce qui concerne les deux autres 
composantes (la fonclion des sauts el la fonclion singulière), elles 
disparaissent «sans laisser de traces ». 

Il y à intérêt à comparer les résultats de ce paragraphe à ce que 
donne la théorie des distributions. De même que dans le chap. IV, 
nous entendrons par distribution une fonctionnelle linéaire conti- 
nue sur l’espace À des fonctions indéfiniment dérivables à support 
borné. À une fonction localement sommable habituelle / on associe 
alors la fonctionnelle qui agit sur les éléments ® € Æ selon la formule 


O0 


Fp= | f(x) pt) dz. 


— O0 


Gette fonctionnelle a pour dérivée au sens des distributions la fonc- 
tionnelle qui à chaque élément @E Æ fait correspondre le nombre 


(f', p)= — | f(x) p’ (x) dx. 
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Puisque dans l’ensemble des distributions l’équation y” = 0 n’a que 
des solutions habituelles (constantes), toute distribution peut être 
rétablie à partir de sa dérivée à une constante près. En particulier, 
toute fonction localement sommable f peut être presque partout 
rétablie à une constante près à partir de sa dérivée au sens 
des distributions jf’. Supposons maintenant que la fonc- 
Lion f ait presque partout une dérivée; à cet effet, supposons, par 


exemple, que la fonclion f soit monotone. Désignons par f; — di la 
dérivée habituelle de la fonction f. (Nous avons déjà vu que a peut 
df 


être nulle presque partout, quoique f (x) = const!) La fonction D 


est localement sommable (f est supposée monotone); par consé- 
quent, on peut lui faire correspondre la fonctionnelle (distribution) 


OO 


Gu o)= | Sp) dz. 


— CC 


L'essentiel est que la distribution f, ne coïncide pas, en général, avec 
la distribution f'. Par exemple, si 


À pour x > 0, 


a ={ 0 pour x<0, 


alors f, — 0 et f” — à (cf. exemple 1, page 200). 

À proprement parler, le théorème 3 exprime précisément le fait 
que parmi toutes les fonctions à variation bornée les fonctions abso- 
lument continues sont les seules dont la dérivée au sens habituel 
coïncide avec la dérivée au sens des distributions. 

Nous nous heurtons ici de nouveau à la situation déjà rencontrée 
au $ 4, chap. IV: pour que les opérations fondamentales de l’ana- 
lyse (dans notre cas il s’agit du rétablissement d’une fonction à par- 
tir de sa dérivée) soient réalisables, il faut ou bien se borner, en 
restant dans les limites des définitions classiques, à une classe de 
fonctions assez restreinte (fonctions absolument continues), ou bien, 
au contraire, généraliser essentiellement la notion de fonction (et en 
même temps celle de dérivée). 


Exercices. 1. Déterminer la dérivée au sens des distributions de 
l'« escalier de Cantor ». 

2. Soient f une fonction à variation bornée, f’ sa dérivée au sens des distri- 
butions et f, la fonctionnelle (distribution), définie par la dérivée «habituelle » 


d 
TL de la fonction f. Démontrer que 


a) si f est absolument continue, alors jf’ — f1; 

b) si f” = fs, la fonction f est équivalente à une fonction absolument con- 
tinue, c.-à-d. coïncide avec une telle fonction presque partout. En particulier, 
si f — f, et jf est continue, alors f est absolument continue. 
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$ 5. L'intégrale de Lebesgue comme fonction d’ensemble, 
Le théorème de Radon-Nikodym 


4. Charges. Décompositions de Hahn et de Jordan. Les notions 
et les faits, exposés dans les paragraphes précédents pour des fonc- 
tions sur la droite, s'étendent en grande mesure à des fonctions 
données sur un espace mesuré arbitraire. 

Soit XÀ un espace quelconque, sur lequel est définie une mesure 
finie u, et soit f une fonction sommable pour cette mesure sur X. La 
fonction f est alors sommable sur toute partie mesurable À de l’en- 
semble X ; par conséquent, l'intégrale 


D(4)= | f(x) du (1) 
À 


(avec f fixée) est une fonction d'ensemble, définie et o-additive sur 
la o-algèbre ©, de tous les ensembles mesurables de l’espace X. 
Ainsi, pour toute décomposition 


A = U Az 
k 


d’un ensemble mesurable À en une réunion finie ou dénombrable 
d’ensembles mesurables deux à deux disjoints, on a l'égalité 


D(A) =2® (A). 


Autrement dit, la fonction ®, définie par l’égalité (1), possède toutes 
les propriétés d’une mesure o-additive, sauf, peut-être, celle de non- 
négativité. (Pour f non négative ® est aussi non négative.) 

Définition 1. Une fonction d'ensemble o-additive (finie) 
D, définie sur une o-algèbre de sous-ensembles de l’espace donné X, 
s'appelle mesure de signe arbitraire ou, plus brièvement, charge. 

La notion de charge est une généralisation naturelle de la notion 
de mesure o-additive et, comme nous le verrons plus tard, se réduit 
en un certain sens à cette dernière. 


Exercice. Démontrer que pour toute charge (finie) ®, donnée sur 
une o-algèbre d’ensembles @, il existe une constante c telle que | PB (4A)|< c 
pour tous les À € @. 

Si l’on considère une charge électrique réelle disposée, par exem- 
ple, sur une surface quelconque, alors cette surface peut être partagée 
en deux zones: l’une portant une charge positive (c.-à-d. telle que 
chacune de ses parties est chargée positivement) et la seconde por- 
tant une charge négative. L’équivalent mathématique de ce fait 
est fourni par le théorème 1, énoncé plus bas. 

Introduisons préalablement la terminologie suivante. Soit ® 
une charge définie sur une o-algèbre © de sous-ensembles de l’espace 
X. Un ensemble £ € © est dit négatif par rapport à D, si ® (EN F)< 
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< 0 vour tout F € G; de manière analogue, Æ est dit positif, si 
D(E N F) > 0 pour tous les F € G. 


lhéorème 1. Si D est une charge définie sur X, il existe un 
ensemble mesurable A7 € X tel que AT est négatif et At = XX AT 
est positif (par rapport à D). 
Démonstration. Posons 
a = inf D (4), 


« 


où la borne inférieure est étendue à tous les ensembles négatifs À. 
Soit {4,} une suite d’ensembles négatifs telle que 


lim ® (Ah) = a. 


J\ 


n+ 00 
Alors il est aisé de voir que A” — |) 4, est un ensemble négatif tel 
que d 
D (47) = a. 
Montrons que À” est l’ensemble cherché, c.-à-d. que 
At = XX A7 


est un ensemble positif. Supposons qu'il n’en soit pas ainsi, c.-à-d. 
que A* contienne un sous-ensemble mesurable C, tel que D (Ci) < 
<< 0. L'ensemble C, ne peut pas être négatif, car alors en l’ajoutant 


à A”, on obtiendrait un ensemble négatif À pour lequel 
D (4) <a, 
ce qui est impossible. Par conséquent, il existe un entier minimal k: 


pour lequel dans C, on peut trouver un sous-ensemble C, vérifiant. 
la condition 


1 
D (C1) > PA 
Bien entendu, C,  C Pour l’ensemble C$XC; on peut reprendre 


le raisonnement fait pour C,; on obtiendra alors un ensemble C; 
vérifiant la condition 


D (Cr) > (f22k4) 
et ainsi de suite. Enfin, posons 
Fo= CON U, Ci. 
L'ensemble F, n’est pas vide, car ® (C5) < 0 et D (C;) > 0 pour 


i > 1. D'après la construction faite, l’ensemble F, est négatif. 
Donc, en l’ajoutant à À, on aboutit de nouveau à une contradiction 
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avec la définition de a. Par conséquent, pour tous les ensembles 
mesurables £ € XX A=ona 


® (E) 2 0, 


ce qui signifie que À X A7 est positif. 
Le théorème est démontré. 
La décomposition de l’espace X en une partie négative À” et une 
partie positive A* s'appelle décomposition de Hahn. 
La décomposition de Hahn n’est pas en général unique. Cepen- 
dant, si 
X == A; |J A; et À — À; |] À; 
sont deux décompositions de Hahn, alors pour tout Æ € G on a 
D(ENA;)=®(EN A), @ 
D(ENAÏ)=D(EN Ai). 
En effet, 
EN(A; NN 4) € EN Ar, (3) 
d’où l’on déduit que 
D(EN(ASN 45))<0. 
D'autre part, 
EN(ASNA;)CENA;, (4) 
d’où 
D(EN (AN 4;))>0. 
Par conséquent, 
D(EN(ASXA,))= 0. 
De la même façon on montre que 
D(EN (A, X 41) =0. 
De ces deux dernières égalités on déduit que 
D(ENA;)=D(EN 45). 


La deuxième des égalités (2) se démontre exactement de la même 
façon. 

Ainsi, la charge ® définit sur @ de façon unique deux fonctions 
d'ensemble non négatives : 

Ot(E£) = OD(EfN A+) 
‘et 
D-(E) = —D(EN A”), 

appelées respectivement variation supérieure et variation inférieure 
de la charge ®. En outre, il est évident que: 


1) D = D+— D-, 


$ 5] L'INTÉGRALE DE LEBESGUE COMME FONCTION D’ENSEMBLE 347 


2) Det D sont des fonctions d’ensembles o-additives et non 
négatives, c.-à-d. des mesures. 

La fonction | D | — D++ D est évidemment aussi une mesu- 
re ; on l’appelle variation totale de la charge ®. La représentation de 
® comme différence de sa variation supérieure et sa variation infé- 
rieure s'appelle décomposition de Jordan de la charge ®. 

Remarque. Nous avons considéré plus haut des charges 
finies, c.-à-d. des fonctions ® dont les valeurs sont bornées infé- 
rieurement aussi bien que supérieurement (cf. exercice, page 344). 
Dans ce cas, D* et D sont des mesures finies. Tout ce qui a été dit 
à leur égard peut être généralisé aux charges bornées seulement 
d'un côté, c.-à-d. telles que l’une au moins des quantités inf ® (4) 
et sup ® (4) est finie. 

2. Les pricipaux types de charges. Soit u une mesure o-additive 
définie dans l’espace X sur une o-algèbre @. Les ensembles appar- 
tenant à © seront dits mesurables. Introduisons les notions sui- 
vantes. 

Nous dirons qu’une charge ®, définie pour les ensembles E € ©, 
est concentrée sur un ensemble mesurable À,, si D (E) — 0 pour tout 
E € X\X4,. L'ensemble À, est alors appelé support de la charge ©. 

Une charge D est dite continue, si D (E) — 0 pour tout ensemble 
E comportant un seul point. Une charge ® est dite discrète, si elle 
est concentrée sur un ensemble fini ou dénombrable. En d’autres 
termes, une charge ® est discrète, s’il existe un ensemble fini ou 
dénombrable de points €,, Co, . . ., Cn, . . . tel que pour tout E € X 
on à 


D (E) — D D (cx). 

CREE 
Une charge ® est dite absolument continue (par rapport à une mesure 
donnée u), si ® (4) — 0 pour tout ensemble mesurable À tel que 
u (4) = 0. 

Une charge ® est dite singulière (par rapport à la mesure pu), si 
elle est concentrée sur un ensemble de u-mesure nulle. Il est clair 
que si une charge est à la fois absolument continue et singulière par 
rapport à la mesure u, alors elle est nulle. 

3. Charges absolument continues. Théorème de Radon-Nikodym. 
Un exemple de charge absolument continue par rapport à une mesure 
donnée u est fourni par l'intégrale de Lebesgue 


D(4)= | f(x) du 


A 
(d'une fonction sommable fixée f), considérée comme fonction d’en- 


semble. Il se trouve que cet exemple épuise toutes les charges abso- 
lument continues. En d’autres termes, on a le théorème suivant. 
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Théorème 2 (de Radon-Nikodym). Soit p une 
mesure (finie) o-additive, définie sur une o-algèbre de sous-ensembles 
de X, et soit ® une charge absolument continue par rapport à u et 
définie sur la même o-algèbre. Alors il existe une fonction f, définie 
sur X et sommable par rapport à un, telle que 


D(4)= | j(x)du 


A 


pour tout ensemble mesurable A. Cette fonction, appelée dérivée de la 
charge ® par rapport à la mesure pu, est définie de façon unique à la 
u-équivalence près. 


Démonstration. Toute charge peut être représentée sous 
la forme d’une différence de deux charges non négatives (cf. n° 2); 
de plus, toute charge absolument continue peut être représentée 
sous la forme d’une différence de deux charges non négatives abso- 
lument continues. Pour cette raison, il suffit de démontrer le théo- 
rème pour des charges non négatives, c.-à-d. pour des mesures. Soit 
donc ® une mesure absolument continue par rapport à la mesure 
donnée u. Démontrons le lemme suivant. 


Lemme. Soit ® une mesure absolument continue par rapport à 
u et non identiquement nulle. Alors il existe un entier naturel n et un 
ensemble mesurable B tels que n (B) > 0 et B est positif relativement 


x 1 
à la charge D —— u. 

Démonstration du lemme. Soit À — Ah |} Ai la 
décomposition de Hahn pour la charge D—— u,n —=1,2,...,et 
soit 


Alors 
_, 1 _ 
D (45)<—+ n (45) 


pour tous les n, c.-à-d. ®(4;) = 0; par conséquent, D (45) > O0 et 
donc u (45) > 0 (en vertu de la continuité absolue de ® par rapport 
à u). Pour cette raison, il existe n tel que u (4%) > 0. Ce nombre nr 
et l’ensemble B = A4% vérifient les conditions du lemme. 

Passons maintenant à la démonstration du théorème. Soit K 
l’ensemble des fonctions f sur X possédant les propriétés suivantes: 
elles sont non négatives, intégrables par rapport à u et 


| (x) du & D (4) 


À 
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pour tout ensemble mesurable A. Soit 
M =sup { POLT fEK}. 
x 


Considérons une suite {f,} de fonctions de K telle que 
lim | fn(x) du= M. 
nr 00 Y 


Posons 
En (x) = max (fix), fo (&), + + ., fn (x). 


Montrons que g, € K, c.-à-d. que pour tout ensemble mesurable Æ 
on à 


| en (x) du < D(E). 
E 


En effet, Æ peut être mis sous la forme 
n 
E — Ü E;, 
k=1 


où Æ£, sont des ensembles disjoints et g, (x) — fr (x) sur Æ,; par 
conséquent, 


fete) [ho due) d(E)=0(,E). 
E k=1 ER k=—2 
Posons 
f (x) = sup {fn (x)}- 
Il est clair qu’alors f (x) — lim g, (x) et donc, d’après le théorème 
de B. Levi, on a 
| f(a) du= lim | gn(x)du= M. 
X no v 


Montrons maintenant que 
D(Æ)— | f(x) du=0. 
Ë 


D'après la construction, la fonction d'ensemble 


h(E)=D(E)— | f(x) du 


E 


est non négative et jouit de toutes les propriétés d’une mesure. 
Elle est, en outre, absolument continue par rapport à u. Si À & 0, 
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d’après le lemme il existe & >> 0 et B tels que u (B) > 0 et 
eu (EN B)<A(EN B) 
pour tout ensemble mesurable Æ. Alors, en posant k (x) — f (x) + 


+ eXp (x), où x est la fonction caractéristique de l’ensemble B, 
on obtiendrait pour tout ensemble mesurable Æ 


(n(a)du= | f(x) du+eu (EN B)< 
E E 


< | (a) du+D(ENB)<D(E). 
EX B 
Cela signifierait que la fonction k appartient à l’ensemble Æ défini 
plus haut. Maïs, d’autre part, 


(r(sdu= | f(a)du+eu(B)> M 
ZX 


À 


ce qui contredit la définition de M. Ainsi, l'existence de la fonction 
f telle que 


D (4)= | f(x) du 
À 
est démontrée. Démontrons l’unicité de cette fonction. Si pour tous 
les AG 
D(4)= | A(a)du= | (x)du, 
À À 
alors, quel que soit n, pour 


An = {x hf >+) 
on a 


pe (An) & n À (1 (æ)— f(x) du = 0. 
An 


De même, pour 
1 
Bu {ai hits) fa (> + 
on à 
U (Bm) = 0. 
Comme 


{2: f(x) fa (x)} = CU An) U CU Ba), 


on en déduit que 


nu {c:f1 (x) Æ fa (x)} = 0. 


$ 6] INTÉGRALE DE STIELTJES 351 


Cela signifie que jf, (x) = f2 (x) presque partout. La démonstration 
est achevée. 

Remarque. Le théorème de Radon-Nikodym est évidemment 
une généralisation naturelle du théorème de Lebesgue affirmant que 
toute fonction absolument continue est égale à l'intégrale de sa 
dérivée. Cependant, si dans le cas des fonctions sur la droite nous 
disposons d’une méthode effective de recherche de la dérivée telle 


que le calcul de la limite du rapport À, le théorème de Radon-Niko- 


dym ne fait qu'établir l’existence de la dérivée Te d’une charge 
absolument continue ® par rapport à la mesure u, sans indiquer une 
méthode de calcul de cette dérivée. Une telle méthode peut être 


indiquée, mais nous n'insisterons pas là-dessus. Dans ses grandes 
e ° « . . D A 

lignes, elle consiste à calculer la limite du rapport es quand À 
parcourt une famille d’ensembles « convergeant », en un certain 
sens, vers un point donné. Ces questions sont exposées en détail, 


par exemple, dans [53]. 


$ 6. Intégrale de Stielties 


1. Mesures de Stieltijes. Dans le $ 1 du chapitre précédent, en par- 
lant de la construction des mesures de Lebesgue sur la droite, nous 
avons déjà mentionné la construction suivante. Soit F une fonction 
monotone non décroissante, donnée sur un segment la, b], que nous 
supposerons, pour fixer les idées, continue à gauche. En définissant 
la mesure de tous les intervalles fermés, ouverts et semi-ouverts con- 
tenus dans le segment donné [a, b] à l’aide des égalités 


ma, f) = F (8) — F (x + 0), 
m la, fl = F(B +0) — F (x), (1) 
m (a, Bl= F(B + 0) — F (x + O), 

m [a, ) — F (8) — (æ), 

nous pouvons étendre ensuite cette mesure, moyennant le procédé 
de prolongement d’une mesure selon Lebesgue, à une o-algèbre cp 
contenant tous les sous-ensembles ouverts et fermés (donc, tous les 
sous-ensembles boréliens) du segment [a, b]. La mesure ur obtenue 
à l’aide d’une telle construction s'appelle mesure de Lebesgue-Stieltjes 
engendrée par la fonction F; la fonction F elle-même s'appelle 
fonction génératrice de cette mesure 1). 


1) Lorsque la fonction non décroissante F n’est pas continue à gauche, on 
peut aussi définir une mesure, en modifiant convenablement les formules (1); 
il faut, par exemple, poser mla, 6] = F (B + 0) — F (x — 0), etc. 
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Considérons quelques cas particuliers des mesures de Lebesgue- 


Stieltjes. 
1. Soient F une fonction des sauts, x,, æo, . .. ses points de 
discontinuité et X,, 2, . . . les valeurs de ses sauts en ces points. 


Alors la mesure ur engendrée par cette fonction est telle que tous 
les sous-ensembles du segment [a, b]l sont mesurables et la mesure 
d’un ensemble À est égale à 


ur (À) = D hi. (2) 
x;,EA 


En effet, de la définition d’une mesure de Lebesgue-Stieltjes il suit 
aussitôt que la mesure de chaque ensemble {x;} est égale à h; et la 
mesure du complémentaire de l’ensemble {x,, x, . . .} est nulle. 
En vertu de l’additivité dénombrable de la mesure ur, on en déduit 
l'égalité (2) pour tout À € [a, b]. La mesure ur, obtenue à partir 
d'une fonction des sauts, s'appelle mesure discrète. 

2. Soit F une fonction absolument continue non décroissante 
sur la, b] et soit f — F” sa dérivée. Alors la mesure correspondante 
ur est manifestement définie pour tous les sous-ensembles du seg- 
ment [a, b] mesurables au sens de Lebesgue et pour tout ensemble À 
de ce typeona 


ur (4)= | f(x) da. (3) 


A 
En effet, d’après le théorème de Lebesgue, pour tout intervalle (x, B) 


B 
be (a, B)=F(B)—F(a)= | f(a)dz. 


œ 


Comme le prolongement selon Lebesgue de toute mesure o-additive 
est défini de façon unique par ses valeurs sur le demi-anneau initial, 
on en déduit que l’égalité (3) est vraie pour tous les ensembles 4 & 
C la, b] mesurables au sens de Lebesgue. La mesure ur associée 
à une fonction absolument continue F s'appelle mesure absolument 
continue. 

3. oi F est une fonction continue singulière, la mesure corres- 
pondante ur est concentrée entièrement sur l’ensemble de mesure 
de Lebesgue nulle où 7” est différente de zéro ou n'existe pas. Dans 
ce cas la mesure ur est dite singulière. 

Il est clair que si F = F, + F,, alors ur = Ur, + ur> Par 
conséquent, du fait que toute fonction monotone est somme d’une 
fonction des sauts, d’une fonction absolument continue et d’une 
fonction singulière, il résulte que toute mesure de Lebesgue-Stieltjes 
peut être représentée sous la forme d’une somme de trois composantes, 
dont l’une est discrète, la seconde absolument continue et la troisième 
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singulière. Rappelons que la décomposition d’une fonction monotone 
en somme de trois composantes est définie à des termes constants 
près. On en déduit que la représentation de toute mesure de Lebes- 
gue-Stieltjes comme somme d’une mesure discrète, d’une mesure 
absolument continue et d’une mesure singulière est unique. 

Tout ce qu’on vient de dire se rapporte aux mesures de Lebesgue- 
Stieltjes sur unsegment. Soit maintenant F une fonction mono- 
tone non décroissante et bornée (supérieurement et inférieurement), 
définie sur toute la droite numérique. En définissant la mesure de 
tout intervalle fermé, ouvert ou semi-ouvert de la droite à l’aide des 
formules analogues aux égalités (1), on obtiendra une mesure finie 
sur la droite numérique toute entière que nous appellerons égale- 
ment mesure de Lebesgue-Stieltjes. En particulier, la mesure de la 
droite toute entière dans ce cas sera égale à 


k F (co) — F (— co), 
où 
F(o)= lim F(x), F(—o)= lim F(x) 


{l'existence des limites résulte du fait que F est monotone et bornée). 

La notion de mesure de Lebesgue-Stieltjes épuise en réalité toutes 
les mesures (c.-à-d. toutes les fonctions d'ensemble finies, o-additives 
el non négatives) sur la droite. En effet, soit u une telle mesure, 
choisie arbitrairement. En posant 


F (x) — u (— OO ; x), 


on obtient une fonction monotone dont la mesure de Lebesgue-Stiel- 
tjes correspondante coïncide avec la mesure initiale u. Ainsi, le 
terme « mesure de Lebesgue-Stieltjes » ne met pas en évidence une 
classe spéciale de mesures sur la droite; il indique seulement une 
méthode particulière de construction de telles mesures: à partir 
d’une fonction génératrice donnée. 

2. Intégrale de Lebesgue-Stieltjes. Soit u} une mesure sur le 
segment [a, b], engendrée par une fonction monotone F. Pour cette 
mesure on définit comme d'habitude la classe des fonctions som- 
mables et la notion d’intégrale de Lebesgue 


b 
| (a) dur. 


Une telle intégrale, prise par rapport à la mesure ur engendrée par 
la fonction F, s'appelle intégrale de Lebesgue-Stieltjes et se note 
b 


FOL HO) 


a 
Considérons quelques cas particuliers. 


23—0167 
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1. Si F est une fonction des sauts (c.-à-d. si ur est une mesure 
discrète), l'intégrale 


b 
| f(x) dF (a) 


a 


se réduit, évidemment, à la somme 
dif (xi) hi, 
1 


où x; sont les points de discontinuité de la fonction F et h; sont les 
sauts de F'en ces points. 

2. Si F est une fonction absolument continue, l'intégrale de 
Lebesgue-Stieltjes 


b 
| F(x)4F (a) 


est égale à 
b 


| f(x) F'(x) dx, 


a 


c.-à-d. à l'intégrale de f (x) F” (x), prise par rapport à la mesure 
habituelle de Lebesgue. En effet, si f (x) — const sur un ensemble 
mesurable À € [a, b] et f (x) — 0 en dehors de À, l'égalité 


b bd 
À f(x) dr (a)= À f(x) F' (æ)da (4) 


est une conséquence de l'égalité (3). En vertu de l’additivité dénom- 
brable des intégrales, l'égalité (4) s'étend également aux fonctions 
simples, sommables pour la mesure ur. Soit maintenant {f,} une 
suite de fonctions simples, convergeant uniformément vers f. On 
peut supposer que la suite {f,} est non décroissante. Alors {f, (x)} 
est une suite non décroissante, presque partout convergeant vers 
f(x) F' (x), et, en vertu du théorème de B. Levi, dans l'égalité 


b b 
| fn (a) dE (x) = | fn (x) F' (x) dx 


on peut passer à la limite pour n — c. 

D'après ce qui précède, il est clair que si F est somme d’une fonc- 
tion des sauts et d’une fonction absolument continue, l'intégrale 
de Lebesgue-Sieltjes pour la mesure ur se réduit à une série (ou som- 
me finie) et une intégrale par rapport à la mesure habituelle de 
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Lebesgue. Si F contient, en outre, une composantesinguliè- 
re, une telle réduction est impossible. 

La notion d'’intégrale de Lebesgue-Stieltjes peut être étendue de 
façon naturelle, en passant des fonctions monotones à des fonctions 
arbitraires à variation bornée. Soit ® une telle fonction. Mettons-la 
sous la forme d’une différence de deux fonctions monotones 


D = v — g, 


où v est la variation totale de la fonction ® sur le segment [a, xl. 
Définissons maintenant l'intégrale de Lebesgue-Stieltjes par rap- 
port à ® en posant 

b b b 

[ (x) 4 (x)= | f(2) )do(e)— | (a) de (a 


a 


On vérifie sans peine que si ® est représentée d’une autre façon par 
une différence de deux fonctions monotones, soit 


D = w — h, 
alors 


b b b b 
À #02) do (e)— Ÿ f(x) de (e) = Ÿ Fe) du (a) — Ÿ (2) d (a). 


La 


Autrement dit, pour calculer l'intégrale de Lebesgue-Stieltjes par 
rapport à une fonction donnée ®, on peut se servir de n'importe quel- 
le représentation de cette fonction par une différence de deux 
fonctions monotones. 

3. Quelques applications de l’intégrale de Lebesgue-Stielties en 
théorie des probabilités. L'intégrale de Lebesgue-Stieltjes est 
employée non seulement en analyse, mais aussi dans beaucoup de 
questions des mathématiques appliquées. En particulier, cette notion 
est largement utilisée en théorie des probabilités. Rappelons 
qu'on appelle jonction de répartition d’une variable aléatoire £ la 
fonction F, définie pour chaque x par l'égalité 


F (x) = P(E< 2), 


c.-à-d. F (x) est la probabilité pour que la variable aléatoire £ pren- 
ne une valeur inférieure à x. Il est évident que chaque fonction de 
répartition est monotone non décroissante, continue à gauche et 
vérifie les conditions 


F(— ©o)—0, F(+ oo) — 1. 


Réciproquement, toute fonction possédant ces propriétés peut être 
considérée comme fonction de répartition d’une variable aléatoire. 


23* 
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Les caractéristiques essentielles d’une variable aléatoire sont 
son espérance mathématique 


ME = | x dF(x) (5) 
et sa variance 


DE — | (x— ME) dF (x). (6) 


Parmi les variables aléatoires on distingue habituellement celles 
que l’on appelle respectivement discrètes et continues. Une variable 
aléatoire est dite discrète, si elle ne peut prendre qu’un nombre fini 
ou une infinité dénombrable de valeurs 


Li Lo) ..) Lns :- 


(par exemple, le nombre d’appels à un central téléphonique pendant 
un certain intervalle de temps est une variable aléatoire discrète). 

Si Pis Dos + + + Pns - - . Sont les probabilités avec lesquelles la 
variable Ë prend les valeurs x,, x2, . . ., æn, . . ., la fonction de 
répartition de & est, évidemment, une fonction des sauts. Pour une 
telle fonction les intégrales (5) et (6) se réduisent respectivement aux 
sommes 


ME =? TiPi 
et 
DE => (x; — ap; (a MÉ). 


Une variable aléatoire & est dite continue, si sa fonction de réparti- 
tion F est absolument continue. La dérivée F” de cette fonction 
s'appelle densité de répartition des probabilités de la variable aléatoire 
6. Conformément à ce qui a été dit au numéro précédent, pour une 
variable aléatoire continue les intégrales de Lebesgue-Stieltjes expri- 
mant son espérance mathématique et sa variance se réduisent aux 
intégrales suivantes, prises par rapport à la mesure habituelle de 
Lebesgue : 


ME — | xp(x)dx, 
DE= | (a—a)p(x)dz, 


où p — F” est la densité de répartition des probabilités de Ë et 
a = ME. 
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Dans les cours élémentaires de théorie des probabilités on se 
borne habituellement aux variables aléatoires discrètes et continues 
qui sont pratiquement les seules que l’on rencontre dans les questions 
des mathématiques appliquées. Toutefois, la fonction de répartition 
d’une variable aléatoire peut contenir encore une composante singu- 
lière, de sorte que les variables aléatoires discrètes et continues ne 
sont pas, en général, les seules composantes d’une variable aléatoire 
arbitraire. 

Soient & une variable aléatoire, F sa fonction de répartition et n =  (£) une 
autre variable aléatoire, fonction borélienne de la première. L’espérance mathéma- 


tique Mn de la variable n peut s’écrire, par définition, sous la forme 
O0 


| x dO (x), 


— 00 


où D est la fonction de répartition de n. Mais l'essentiel est que si la fonction 
est sommable pour la mesure engendrée sur la droite par la fonction F, l’espé- 
rance mathématique de la variable n peut. s'exprimer aussi par la fonction de 
répartition F de la variable £: 


O0 


Mn=MQ (E)— | E (x) dF (x). 
En effet, la fonction y = œ (x) définit une application de la droite (—o <<r< 


<Z ) avec la mesure u} (engendrée par F) dans la droite (— oo y << ©) avec 
la mesure 4, transformée de uF par l'application y — œ (x). Or, d’après les 


résultats du chapitre V, si (X,u) et (Y, v) sont deux espaces mesurés, p est 
une application de (X, u) dans (Y, v) conservant la mesure (c.-à-d. telle que 
v (4) = u (1 (4))) et f est une fonction sommable sur (Y, v), alors 


| ju) dv = | 5 (p (a) ap 
Y X 


(changement de variable dans l'intégrale de Lebesgue). En posant ici f (y) = y, 
u = pp et v = ua, on obtient l'égalité désirée. Ainsi, pour calculer l’espérance 


mathématique (et, bien sûr, la variance) d’une fonction de la variable E, 
il suffit de connaître seulement la fonction de répartition de cette variable. 


4. Intégrale de Riemann-Stieltijes. A côté de l’intégrale de Lebes- 
gue-Stieltjes, considérée plus haut et représentant en fait la diffé- 
rence de deux intégrales de Lebesgue d’une fonction donnée jf, prises 
par rapport à deux mesures données sur la droite, on peut introduire 
encore l'intégrale dite de Riemann-Stieltjes. Elle est définie comme 
limite des sommes intégrales analogues aux sommes intégrales 
habituelles de Riemann. 

Soit de nouveau ® une fonction à variation bornée continue à 
gauche, définie sur un intervalle semi-ouvert [a, b), et soit f une 
fonction arbitraire, définie sur le même intervalle semi-ouvert [a, b). 
Considérons une partition de [a, b) réalisée par les points 


A = L LU LIL... LE = b. 
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Sur chaque élément Î{x;_,, x;) de cette partition !) choisissons un 
point arbitraire Ë; et formons la somme 


2: FE) D (1) — D (xi-1, (7) 


où par D (x,) on sous-entend D (b — 0). Si pour max (x; — x;_,) — 0 
cette somme tend vers une certaine limite (qui ne dépend ni des 
partitions choisies de l'intervalle [a, b), ni du choix des points Ë; 
sur les éléments de ces partitions), cette limite s'appelle intégrale 
de Riemann-Stieltjes de la fonction f par rapport à la fonction ® sur 
[a, b) et se note 


b 
À f(x) D (x). (8) 


Théorème 1. Si f est une fonction continue sur le segment 
[a, b], alors son intégrale de Riemann-Stieltjes (8) existe et coïncide 
avec l'intégrale correspondante de Lebesgue-Stieltjes. 


Démonstration. Lasomme (7) peut être considérée comme 
l'intégrale de Lebesgue-Stieltjes de la fonction en escalier 


fni(x)= f(E:) pour ti4<r < ri. 


Lorsqu'on fait diminuer les éléments de la partition de l’inter- 
valle (a, b]l, on obtient une suite de telles fonctions qui converge 
uniformément vers f. C’est pourquoi la limite des sommes en question 
existe et coïncide avec l'intégrale de Lebesgue-Stieltjes de la fonc- 
tion limite f (théorème du passage à la limite sous le signe d’inté- 
gration). D'autre part, c’est précisément cette limite que nous avons 
appelée intégrale de Riemann-Stieltjes (8). 

Le théorème est démontré. 

On se propose maintenant d'établir quelques propriétés élémen- 
taires de l'intégrale de Riemann-Stieltjes. Partout ici la fonction / 
sera supposée continue sur [a, b). 

1. On a l'évaluation (théorème de la moyenne) 


b 
| À 7 (0) 4D (x)] <max | (21 Va LOI, (9) 


a 


où Vb[®] désigne la variation totale de la fonction ® sur [a, b). 


1) Comme dans l'intégrale de Stieltjes l'apport des points séparés peut être 
différent de zéro, les éléments de la partition ne doivent pas avoir des points 
communs. C’est pourquoi nous prenons ici des intervalles semi-ouverts. 
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En effet, pour toute partition de l'intervalle [a, b) on a l’inéga- 
lité 


> f (&:) (D (xi) — D (xi-1)) 


D ED II (0 (ei) < 


< max] (a)le D 1D (æ)— D (ais) | max | (æ) | VEIDI. 


En passant à la limite dans cette inégalité, on obtient l’évalua- 
tion (9). Pour ® (x) — x elle donne l'évaluation bien connue 


b 
| | f(x) L(b—a)max|f(x)| 


a 


pour l'intégrale de Riemann. 
2. Si D — D, + D», alors 
b b b 
POLICE IOL ICE IOL UTC) 


a a 


En effet, pour toute partition de l'intervalle [a, b) l'égalité cor- 
respondante est vraie pour les sommes intégrales; par conséquent, 
elle est conservée aussi à la limite, c.-à-d. pour les intégrales. 

Nous avons défini l'intégrale de Riemann-Stieltjes (8), en sup- 
posant que la fonction ® (x) est continue à gauche. Pourtant, la 
définition de cette intégrale comme limite de la somme (7) est va- 
lable pour toute fonction ® (x) à variation bornée. Dans ce cas on a 
la proposition suivante. 

3. Si P, et D, sont deux fonctions à variation bornée sur [a, b) 
coincidant partout, sauf sur un ensemble fini ou dénombrable de points 
intérieurs de cet intervalle, alors 


b b 
À f(x) dDi (x) = | 7 (x) dD: (x) 


pour toute fonction f continue sur La, b]. 

Pour démontrer cette proposition, considérons d’abord le cas, 
où D; = 0, c.-à-d. démontrons l’assertion suivante. 

3”. Si est une fonction à variation bornée, nulle partout, sauf sur 
un ensemble fini ou dénombrable de points intérieurs de l’intervalle 
(a, b), alors 


b 
À 7 (a) di (x) = 0 


pour toute fonction f continue sur [a, b]. 
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En effet, cela est évident pour toute fonction qui ne diffère de 
zéro qu'en un seul point x, (en faisant diminuer indéfiniment les 
éléments de la partition de [a, b), sans que x, soit un point de 
subdivision, on obtient des sommes intégrales nulles); par consé- 
quent, grâce à l’additivité, cette propriété est vraie aussi pour toute 
fonction différente de zéro en un nombre fini de points. Soit mainte- 
nant Ÿ une fonction différente de zéro aux points 

Vas Toy oo Tryo 
et soient 


Us YUos + + +) Une « - 


ses valeurs en ces points. Puisque % est à variation bornée, on à 
D'Un | oo. Choisissons un entier naturel NV de façon que 
n 


>» | Un | LE et écrivons 1 sous la forme 
N 


n> 
Pa 
Ÿ = Ÿn + 
où , est une fonction prenant aux points r1, ..., r A respective- 


ment les valeurs y1, . . ., y, et nulle partout ailleurs, tandis que 
ne diffère de O0 qu'aux points rxyx1, l y, . . . D'après la propriété 
précédente, on a 


b b b 
À Go) db (e)= À FC) diby (0) + À 7 (a) db (a). 


La première de ces intégrales est nulle d’après ce qu’on a déjà dé- 
montré ; la seconde, en vertu de la propriété 1, admet l'évaluation 


b 
À f(x) db (x) | < max | j (x) |-2e 


(car il est évident que V? I =2\ 1m |<Z 2e). Comme € est 
n>N 


arbitrairement petit, on en déduit la proposition annoncée. 

Maintenant, pour démontrer la propriété 3, considérons la diifé- 
rence Ÿ — ®, — ®,. Elle ne diffère de zéro que sur un ensemble fini 
ou dénombrable de points appartenant à (a, b). Il reste à appliquer 
les propriétés 2 et 3’. En particulier, comme une fonction à variation 
bornée a au plus une infinité dénombrable de points de discontinuité, 
on obtient la propriété suivante. 

4. Si f est une fonction continue, l'intégrale de Riemann-Stieltjes 
b 


| f (x) d® (x) ne dépend pas des valeurs que la fonction ® prend en 


a 
ses points de discontinuité situés à l'intérieur de (a, b). 
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Etant donné que l'intégrale de Riemann-Stieltjes d’une fonc- 
tion continue coïncide avec l'intégrale correspondante de Lebesgue- 
Stieltjes, pour l’intégrale de Riemann-Stieltjes d’une fonction con- 
tinue f (x) on a les égalités : 


b 


HOLUIOPDHIOLT 


si D est une fonction des sauts, et 


b b 
HOLICETIOLAOL (10} 


a a 


si O est une fonction absolument continue. Si, en outre, la fonction 
D’ est intégrable au sens de Riemann, l'intégrale du second membre 
de (10) peut être considérée comme une intégrale de Riemann. 

Tout ce qu’on vient de dire au sujet de l’intégrale de Riemann- 
Stieltjes sur un intervalle fini s'étend sans difficulté au cas où l’in- 
tégrale est prise sur la droite toute entière ou sur une demi-droite. 

Remarque. Nous avons défini l'intégrale de Stieltjes sur 
l'intervalle semi-ouvert [a, b). De manière analogue on peut définir 
l'intégrale sur (a, b]l, de même que sur [a, blet (a, b). A la différence 
de l’intégrale habituelle de Riemann, les valeurs de l'intégrale de 
Stieltjes sur les intervalles (a, b), [a, b], [a, b) et (a, b] sont, en géné- 
ral, différentes. Par exemple, si a est un point de discontinuité 
de la fonction ®, l'intégrale de Stieltjes sur [a, b] est égale à l’inté- 
grale correspondante sur (a, b] plus un terme de la forme f (a) h, 
où À — ® (a + 0) — D (a). 

9. Passage à la limite sous le signe de l'intégrale de Stieltjes. 
Au chap. V nous avons démontré quelques théorèmes concernant le 
passage à la limite sous le signe de l'intégrale de Lebesgue. La ques- 
tion était posée alors de la manière suivante : étant donné une suite 
de fonctions {f,} et les intégrales de ces fonctions par rapport à une 
mesure donnée, étudier la possibilité du passage à la limite sous le 
signe d'intégration. Dans le cas de l'intégrale de Stieltjes, il y a 
encore une autre position du problème qui présente de l'intérêt : 
étant donné une suite de fonctions à variation bornée {®, }, à quelles. 
conditions peut-on passer à la limite sous le signe de l'intégrale: 


b 
À f(x) do (x), 


où / est une fonction fixée? 
Dans ce cas on a le théorème suivant. 
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Théorème 2(premier théorème de Hell y). 
Soit {®,} une suite de fonctions à variation bornée sur le segment 
{a, b], convergeant sur ce segment vers une fonction ® et telle que les 
variations totales des fonctions ®, sont bornées dans leur ensemble: 


VoIDI<C (n=1,2, ...). 


Alors la fonction limite ® est aussi à variation bornée et pour toute 
jonction continue j on a 


b b 
lim | f(x) dD, (2)= | (2) 40 (a). (41) 


Démonstration. Montrons tout d’abord que la variation 
totale de la fonction limite ® ne dépasse pas la constante C qui sert 
à majorer l’ensemble des V? [®,]. En effet, pour toute subdivision 


a = L LL... LAm = 0 


du segment [a, bl,on a 
DID) D(a)|= lim 2 |Dn(ai —Dr(as)|& C, 


C.-à-d. 
VSIDI EC. 


Montrons maintenant que la relation (11) est vraie dans le cas où f 
est une fonction en escalier. Soient h; les valeurs de f sur les inter- 
valles (xz-1, xx). Alors 
b 
À £ (x) dDa (x) = 3 An [On (22) — Da (28-5)] 
k 


a 


et 
b 
À Fe) d® (a)= D Ra (D (au) — D (24-01: 
a k 


Il est clair que la première de ces deux expressions tend vers la se- 
conde, quand n — oo. 

Soient f une fonction continue et € un réel positif arbitraire. 
Choisissons une fonction en escalier f, telle que 


f()—-f(< : 
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On a alors 
b 


|| f(æ)d® (a) — | f(x) d®, a < 


a a 


<| avt | fe (2) 4D (x) |+ 


b 


+| | fe (æ) dD (æ) — À fe (x) dDA (2)]+ 


a : : 
+|\ fe (x) dDn (x)— | f(x) d®, (x) |. 


En vertu du théorème de la moyenne pour l’intégrale de Stieltjes, le 
premier et le troisième termes sont inférieurs à _ le deuxième est 


inférieur à + pour tous les n suffisamment grands. Comme & > 0 est 


arbitraire, on en déduit ce qu'il fallait démontrer. 
Remarque. Ce théorème s'étend également au cas où dans 
les intégrales 


b 
| f(x) d®, (a) 


l'une des bornes ou toutes les deux sont infinies. Mais dans ce cas, 
la fonction f doit tendre à l'infini vers une limite finie (ceci permet 
de l’approcher uniformément sur tout l'intervalle infini considéré 
par des fonctions en escalier ne prenant qu’un nombre fini de va- 


leurs). 

Si le premier théorème de Helly établit à quelles conditions doit 
satisfaire une suite {®,} de fonctions à variation bornée, pour que 
dans l'intégrale de Riemann-Stieltjes par rapport à ces fonctions on 
puisse passer à la limite, le deuxième établit les conditions assurant 
l'existence même d’une suite vérifiant les conditions du premier 


théorème. 
Théorème 3 (deuxième théorème de Hel- 
l y). De tout ensemble infini M de fonctions ®, données sur un seg- 
ment quelconque la, b] et vérifiant les conditions 
max|D(x)|<C, VE[DISX (12) 


(où C et ÆÀ sont des constantes, les mêmes pour toutes les fonctions 
® € M), on peut extraire une suite qui soit convergente en tout point 
de La, b]. 
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Démonstration. Il suffit de démontrer ce théorème pour 
des fonctions monotones. En effet, soit 


D = v — g, 


où v (x) est la variation totale de ® sur le segment la, x]. Alors les 
fonctions v correspondant à toutes les ® € AJ vérifient les inégalités 


max|v(x)|ISK, Volv]=VolOl<K, 


c.-à-d. vérifient les conditions du théorème et sont monotones. En 
supposant le théorème démontré pour des fonctions monotones, 
choisissons une suite {®,} de fonctions de AJ telle que la suite des 
fonctions correspondantes v, converge vers une limite v. D'autre 
part, les fonctions 

En —= Un — ®, 


sont aussi monotones et vérifient les conditions du théorème. C’est 
pourquoi, de {®,} on peut extraire une sous-suite (Da,} telle que 


la suite correspondante (gn,} converge vers une limite g. Mais alors 
Dr, (x) D(x)=v(x)— 8 (x). 


Ainsi donc, démontrons le théorème pour une famille M de: 
fonctions monotones. Soient 


ri, To, CET Vn e. + 


tous les points rationnels du segment [a, b]. En vertu des inégalités 
(12), les nombres ® (r;,) (où ® parcourt l’ensemble M tout entier) 
forment un ensemble borné. Par conséquent, il existe une suite 
{D} } convergente au point r. De cette suite on peut extraire une 
sous-suite {D} convergente au point r2 (et, bien entendu, au 
point r1). De {D} on peut extraire une sous-suite convergente au 
point r, et ainsi de suite. La suite diagonale {D } sera, évidemment, 
convergente en tous les points rationnels du segment [a, b]. Sa limite 
est une fonction non décroissante ®, définie pour le moment seule- 
ment aux points F4, Fo, . . ., Tn, - . . Achevons de définir cette fonc- 
tion sur le segment [a, b], en posant pour les x irrationnels ® (x) — 


— Jim ©® (r) (où r ne prend que des valeurs rationnelles). Montrons 
T+x—0 

que la fonction non décroissante ® ainsi obtenue est en chacun de 
ses points de continuité la limite de la suite {®®}. Soit x* l’un de 


ces points. Alors pour tout & > 0 donné il existe Ô = 0 tel que 
[D(x*)—D(x)| < +, dès que |2*—x|< 6. (13) 


Ch oisissons deux points rationnels r” et r” de façon que r" << x* < r” 
et > x* — Ô,r" << x* + 6. Soit maintenant #9 tellement grand 
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que pour tous les n > n, on ait les inégalités 
[De)—-PEN<T et [BD LT. (14) 
De (13) et (14) il résulte que 
CADEUNOIESS 


Comme la fonction ®, est non décroissante, on a D, (r’) < D,(x*) < 
Z D, (r”)}. Par conséquent, 


| D (2%) — Pa (z*) [KP (x*) — D + 
LD (r')— D, ()|+1P:(r)—Da(x*) << +E+E = €. 


ce qui signifie que lim ®, (x*) — ® (x*). 
71— 00 

Ainsi, nous avons construit une suite de fonctions de M conver- 
geant vers une fonction limite ® partout, sauf, peut-être, aux points 
de discontinuité de la fonction D. Comme l’ensemble de tels points 
est au plus dénombrable, en appliquant de nouveau le procédé diago- 
nal, on peut extraire de la suite {®, } une sous-suite convergeant en 
ces points également, c.-à-d. partout sur [a, bl. 

6. Forme générale des fonctionnelles linéaires continues sur l’espa- 
ce de fonctions continues. Plus haut nous avons indiqué certaines 
applications de l'intégrale de Stieltjes. Considérons maintenant 
encore un problème lié à cette notion, plus précisément, déterminons 
la forme générale d’une fonctionnelle linéaire sur l’espace C [a, b]. 


Théorème 4(F. Riesz). Toute fonctionnelle linéaire con- 
tinue F sur l'espace C Ia, b]l peut s'écrire sous la forme 


b 
F(}= | f(æ)d® (a), (15) 


D) 


où ® est une fonction à variation bornée }). En outre, 
I FI= Velo]. 


Démonstration. L'espace C [a, b] peut être considéré 
comme un sous-espace de l’espace A7 [a, b] de toutes les fonctions 
bornées sur le segment [a, b], muni de la même norme que C [a, b]: 


1/1 = sup | f (x). 


Soit F une fonctionnelle linéaire continue sur C [a, b]. En vertu du 
théorème de Hahn-Banach, elle peut être prolongée, en conservant la 
norme, de C [a, b] à l’espace M [a, b] tout entier. En particulier, la 


?) Ici il s'agit d’une intégrale sur le segment [a, b]. 
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fonctionnelle ainsi prolongée sera définie pour toutes les fonctions 
de la forme 


{ LT, 
h(D=0, À (= | pour z<T 


0 pour æx>T, (> a). (6) 
Posons 
DT) = F(k.) (17) 


et montrons que la fonction ® est à variation bornée sur le segment. 
[a, b]. En effet, considérons une subdivision 


a = L LL... LEn = bd (18) 
de ce segment et posons 
on = Sgn (D (xx) —D(x:-1))  (k=1, 2, ...,n). 
Alors 


D | D(xx) — D (xx) | = D Gr (D (zx) — D (xx-1)) — 
k=1 k=1 
=D GE (els, DEF (D ax, —hx, ))< 


R=1 R=1 


<|F 1] > cn (ls, — hs D] 


n 


Or, la fonction > œz (Rx, — h:,_,) ne prend que les valeurs +1 
k—1 


et 0. Par conséquent, sa norme est inférieure ou égale à 1. Donc, 


2, 1P (en) —® (e4)1< IF Il 


Comme cela est vrai pour toute subdivision du segment [a, b], on 
en déduit que 


Va lD}<||F||. 


Ainsi, nous avons construit à partir de la fonctionnelle F une fonc- 
tion D à variation bornée. Montrons que c’est à l’aide de cette fonc- 
tion que la fonctionnelle F s'écrit sous la forme de l'intégrale de 
Stieltjes (15). 

Soit f une fonction arbitraire continue sur [a, b]. Donnons-nous 
un réel positif e et choisissons Ô > 0 de façon que | f (2°) — f (x”)| < 
<< &, si [x — x" | << 6. Choisissons maintenant la subdivision (18) 
de façon que chaque partie ait la longueur inférieure à Ô et considé- 
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rons la fonction en escalier f. définie de la façon suivante: 
fe(x)—=f(xx) pour 211 <xLzr, k=1Â, 2, ...,n, 
fe(a) = f(x1). 


Elle peut, évidemment, s’écrire sous la forme 
P 


fe(z)= À f(2x) Rx, (2) — Rx, (x), 
R=1 
où h, est la fonction définie par l'égalité (16). Il est clair que 
| f (x) — fe (x) |  e pour tous les x (a < x < b), de sorte que 
If (x) — fe (x) [<< €: 


Cherchons la valeur de la fonctionnelle F correspondant à l’élément. 
fe. En vertu de la définition de la fonction k. et de la linéarité de 
cette fonctionnelle, sa valeur est égale à 


F(G)= 2 f (ea) LF (Re) —F (x, = 


—= à Î (tx) [D (zx) — D (tz-1)], 


c.-à-d. représente la somme intégrale pour l'intégrale 
b 


| f(x) dD (a). 


Donc, si le segment [a, b] est partagé en parties suffisamment petites, 
on à 


|FG)— | 140 (2|< e. 
Mais, d'autre part, 


LFP —EFGI<TENANT - ASIE Ie. 
Par conséquent, 


| F(— (2) 4D (æ)] < e(AHIIF 1: 


comme € >> 0 est arbitrairement petit, on en déduit que 
b 


F(N= | f(x) d® (2). 


Nous avons montré que la variation totale de la fonction ®, définie 
par la formule (17), vérifie l'inégalité 


VelDI<| F 


(19) 
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D'autre part, du théorème de la moyenne pour l’intégrale de Riemann- 
Stieltjes il résulte immédiatement que 


IF IIS Va lD1. (20) 
En comparant (17) et (20), on obtient l'égalité 
1 F1= Ve td. 


Le théorème est entièrement démontré. 
Remarque. Ilest clair qu’en prenant une fonction arbitraire 
à variation bornée ® sur le segment [a, b] et en posant 
b 


F(N= | f(x) dD (a), 


Cr 4 


nous obtiendrons une fonctionnelle linéaire sur l’espace C La, b]. Il est 
clair aussi que deux fonctions ®, et ®, coïncidant sur [a, b] partout. 
sauf sur un ensemble fini ou dénombrable de points intérieurs à 
ce segment, définissent la même fonctionnelle linéaire. Récipro- 
quement, si ®, et ®, définissent une même fonctionnelle sur l’es- 
pace C [a, b], c.-à-d. si 

b 


b 
À F(e)4Di (= À 7 (x) dD2 (a) 


a 


pour toute fonction continue f, il est aisé de voir que D, — D, — 
— const en tous les points de continuité de la fonction D; — ®,, 
<.-à-d. partout, sauf, peut-être, sur un ensemble fini ou dénombrable 
de points. 

En rapportant à une même classe d'équivalence n'importe quelles 
deux fonctions à variation bornée sur [a, b] dont la différence ne 
diffère d’une constante que sur un ensemble fini ou dénombrable de 
points intérieurs à [a, b], nous obtiendrons une correspondance 
biunivoque entre ces classes et les fonctionnelles linéaires sur l’es- 
pace C'[a, b]. Autrement dit, toute fonctlonnelle linéaire sur C [a, b] 
s'écrit sous forme d’une intégrale de Stieltjes par rapport à une cer- 
taine charge. Cette charge peut être donnée par une fonction à 
variation bornée, mais la correspondance entre les charges et ces 
fonctions n’est biunivoque qu’à l’équivalence ci-dessus près. 

Pour une fonction arbitraire ® de la classe correspondant à une 
fonctionnelle donnée F on a 


b 
FARSAIUUE 
l'égalité ici peut ne pas avoir lieu, mais, comme le montre la démons- 


tration du théorème, dans chacune de ces classes il y a au moins une 
fonction pour laquelle cetie égalité est réalisée. 


CHAPITRE VII 


Espaces de fonctions 
sommables 


Une classe importante d’espaces normés est constituée par les 
espaces de fonctions sommables. Parmi ces derniers on doit mention- 
ner en premier lieu l’espace L, de toutes les fonctions sommables et 
l’espace L, des fonctions à carré sommable. Nous allons étudier les 
propriétés fondamentales de ces espaces. Le contenu de ce chapitre 
s'appuie d’une part sur les propriétés générales des espaces métri- 
ques et des espaces vectoriels normés, exposées aux chapitres II-IV, 
et d'autre part, sur la notion d’intégrale de Lebesgue, introduite au 
chap. V. 


$S 1. L’espace Z,; 


1. Définition et propriétés fondamentales de l’espace ZA. Soit X 
un espace sur lequel est définie une mesure pu ; la mesure de l’espace 
X tout entier peut être finie ou infinie. La mesure u sera supposée 
complète (ce qui revient à dire que tout sous-ensemble d’un 
ensemble de mesure nulle est mesurable). Considérons l’ensemble de 
toutes les fonctions f sommables sur X. Etant donné que toute com- 
binaison linéaire de fonctions sommables est une fonction sommable, 
cet ensemble, muni des opérations habituelles donnant la somme de 
deux fonctions et le produit d’une fonction par un nombre, constitue 
un espace vectoriel. Nous désignerons cet espace par ZL; (X, u) ou, 
plus brièvement, par L1. Introduisons dans Z; une norme, en po- 
sant *) 


lfl= | 1 du. (1) 
Il est clair qu'’alors 


Hafl=lal-Iff 
fi + RNA + F2 11: 


Pour que la dernière propriété de la norme, à savoir 


If > 0, si j O0, 


1) Ici et dans la suite le symbole | désigne l'intégration sur l’espace X 


et 


tout entier. 
2k&—0167 
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soit aussi réalisée, il faut considérer les fonctions équivalentes sur 
X non comme des fonctions distinctes, mais comme constituant le 
même élément de l’espace L,. En particulier, l'élément nul dans Z, 
est alors la classe des fonctions presque partout nulles. Dans ces 
conditions l'expression (1) jouira de toutes les propriétés de la nor- 
me. On est donc amené à la définition suivante. 

Définition 1. On appelle espace L,; l’espace normé ayant 
pour éléments les classes de fonctions sommables équivalentes entre 
elles ; l’addition des éléments de ZL, et leur multiplication par des 
nombres sont définies comme d'habitude pour les fonctions !), la 
norme sur L: étant définie par la formule 


HEANHOIT 
Dans Z;, comme dans tout espace normé, on introduit la distance à 
l’aide de la formule 
pG, 8 = — 81 


La convergence d’une suite de fonctions sommables au sens de cette: 
distance s’appelle convergence en moyenne. L'espace L; peut être: 
considéré comme formé des fonctions complexes (Z; complexe) ou 
uniquement des fonctions réelles (Z; réel). Le contenu de ce para- 


graphe se rapporte à tous les deux cas. 
Dans beaucoup de questions de l’analyse un fait très important 


est le suivant. 


Théorème 1. L'espace LA est complet. 
Démonstration. Soit {f,} une suite de Cauchy dans Z,. 
c.-à-d. 
| fn — fm 1 —- 0 quand n, m — oo. 


Il existe alors une suite croissante d'indices {n,} telle que 
{ 
Pr ns = À Lg) — fps GE) du < 


De cette inégalité et du théorème de B. Levi, il résulte que la série 
PARENTS IE ES 


est convergente presque partout sur À. Mais alors la série 


fn+ One fn) + 


1) Plus précisément : chaque élément de Z; est une classe de fonctions som- 
mables, équivalentes entre elles ; pour additionner deux de ces classes, on choi- 
sit dans chacune d'elles un représentant, on fait la somme des représentants 
choisis et on prend pour somme des deux classes considérées la classe qui con- 
tient la somme des représentants choisis. Il est clair que le résultat ne dépend pas 
du choix des représentants. On procède de même pour multiplier un élément. 


de L;, par un nombre. 
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converge aussi presque partout sur À vers une fonction 
j(x)= lim fn, (x). 
k— 00 


Ainsi, toute suite de Cauchy dans Z, contient une sous-suite 
convergente presque partout. 

Montrons maintenant que la sous-suite Ün,} converge en moyen- 
ne vers la même fonction f. Comme {f,} est une suite de Cauchy, 
quel que soit & >> 0, pour k et l assez grands on a 


À Lény @)— fn, (@) 1 du < €. 


D'après le théorème de Fatou, dans cette inégalité on peut passer à 
la limite sous le signe somme pour / — oc. On obtient alors 


| fn, (x) — f(x) |du <e, 


d’où l’on déduit que f € L; et que f,, —+ f. Or, si une suite de Cau- 
chy contient une sous-suite convergeant vers une certaine limite, 
elle converge elle-même vers cette limite. 

Le théorème est démontré. 

2. Ensembles partout denses dans Z;. Pour toute fonction f som- 
mable sur X, quel que soit & > 0, il existe une fonction simple som- 
mable œ (x) telle que 


[IFG)—pG)Idu < e. 


D'autre part, comme l'intégrale d’une fonction simple sommable 


prenant les valeurs y4, yo, . . . sur les ensembles Æ,, E,, . .., est 
définie comme la somme de la série 

O0 

» Ynl (En) 

n=1 


(à condition qu’elle soit absolument convergente), il est clail que 
toute fonction simple sommable peut être considérée comme la limi- 
te (en moyenne) d’une suite de fonctions simples dont chacune ne 
prend qu’un nombre fini de valeurs. Par conséquent, les fonctions 
qui ne prennent qu'un nombre fini de valeurs (c.-à-d. qui représen- 
tent des combinaisons linéaires finies de fonctions caractéristiques) 
forment un ensemble partout dense dans L,. 

Soit À un espace métrique sur lequel est définie une mesure 
vérifiant la condition suivante (qui est vérifiée par la mesure de 
Lebesgue sur un espace euclidien, ainsi que dans beaucoup d’autres 
cas qui présentent de l'intérêt pratique): tous les ensembles ouverts 
et tous les ensembles fermés dans R sont mesurables et pour tout ensem- 


24* 
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ble mesurable M € R et pour tout & >> 0 il existe un ensemble ouvert 


G = M tel que 
u (GKM) < &. (2) 
Alors on a le théorème suivant : 


Théorème 2. L'ensemble de toutes les fonctions continues 
sommables est partout dense dans L1(R, u). 


Démonstration. D’après ce qui précède, il suffit de dé- 
montrer que toute fonction simple prenant un nombre fini de valeurs 
est la limite, au sens de la convergence en moyenne, d’une suite de 
fonctions continues. Or, comme toute fonction simple sommable 
prenant un nombre fini de valeurs est une combinaison linéaire de 
fonctions caractéristiques X (x) des ensembles mesurables de mesu- 
re finie, il suffit de faire la démonstration pour ces derniers. Soit À7 
un ensemble mesurable de l’espace métrique R et soit u (M) < co. 
Alors de la condition (2) on déduit immédiatement que pour tout 
£ > 0 il existe un ensemble fermé F,, et un ensemble ouvert G;; 
tels que 


Fr =MEGretu (Gr Fu) < €. 


Définissons maintenant une fonction œ,(x), en posant!) 


: p(z, RG) 
PE GA Gin +0 Fan): 


Cette fonction est égale à O pour x € R\X Gwm et à 1 pour x € F,;. 
Elle est continue, car chacune des fonctions p (x, Fr) et p (x. RG) 
est continue et leur somme ne s’annule nulle part. La fonction 
Xm — Pe ne dépasse pas 1 sur Gy  F} et s’annule en dehors de cet 
ensemble. Par conséquent, 


À La (x) — qe (a) du < 6, 


d’où l’on déduit l'affirmation du théorème. 

Il est clair que l’espace L, (X, u) dépend aussi bien du choix de 
l’espace X, que du choix de la mesure u sur cet espace. Par exemple, 
si la mesure u est concentrée en un nombre fini de points, L4 (X, u) 
sera simplement un espace de dimension finie. En analyse, le rôle 
fondamental revient aux espaces ZL, de dimension infinie conte- 
nant un sous-ensemble dénombrable et partout dense. Pour caracté- 
riser les espaces L; de ce genre, introduisons encore une notion qui, 
au fond, se rapporte à la théorie générale de la mesure. 

Définition 2. La mesure u s'appelle mesure à base dénom- 
brable, s’il existe une famille dénombrable 


A = {An} (n —=1,2,...) 


1) p (x, À) désigne la distance du point x à l’ensemble À. 
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de sous-ensembles mesurables de l’espace X (base dénombrable de 
la mesure u) telle que pour tout ensemble mesurable M € X et pour 
tout & >> Oil existe un 4x € # tel que 


u (M A A) << E&. 


En particulier, la mesure u a une base dénombrable, si on peut 
la considérer comme le prolongement selon Lebesgue d’une mesure 
m, définie sur un demi-anneau dénombrable ©. En effet, dans ce 
cas l’anneau À (©) (évidemment, dénombrable) est précisément la 
base cherchée. De Ià on voit, par exemple, que la mesure de Lebesgue 
sur un segment a une base dénombrable, car pour cette mesure on 
peut prendre en qualité de demi-anneau initial l’ensemble des inter- 
valles semi-ouverts à extrémités rationnelles. 

Le produit u — u1 X u2 de deux mesures à bases dénombrables 
est aussi une mesure à base dénombrable, car les réunions finies de 
produits d'éléments appartenant à la base de la mesure nu, par des 
éléments appartenant à la base de la mesure u, forment, comme il 
est aisé de le vérifier, une base de la mesure pu — u4 X m2. On en 
déduit que la mesure de Lebesgue sur le plan (aussi bien que dans 
un espace à z dimensions) a une base dénombrable. 

Soit 

At, AB, ..., Aë, (3) 


une base dénombrable de la mesure u. Il est aisé de voir que la fa- 
mille (3) peut être élargie de façon à obtenir une nouvelle base dénom- 
brable de cette mesure 


Ai, An ee Anse. (4) 


close par rapport à la soustraction et aux réunions et intersections 
finies d’ensembles, c.-à-d. possédant la structure d’anneau. 


Théorème 3. Si la mesure a une base dénombrable, dans 
L, (X, u) il existe un ensemble dénombrable et partout dense de fonc- 
lions. 


Démonstration. Montrons que les sommes finies 
ñn 


2 ChÎr (x), (9) 


où c;, sont des nombres rationnels et f, sont des fonctions caracté- 
ristiques des éléments appartenant à la base dénombrable de la 
mesure u, forment un ensemble dénombrable et partout dense dans 
L; (X, u). 

La dénombrabilité d’un tel ensemble est évidente ; montrons qu’il 
est partout dense dans Z; (X, u). Comme nous l’avons déjà montré, 
l’ensemble des fonctions en escalier ne prenant qu’un nombre fini 
de valeurs est partout dense dans Z4. Comme toute fonction de ce 
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type peut être approchée avec la précision que l’on veut par des 
fonctions du même type, mais ne prenant que des valeurs rationnel- 
les, il suffit de montrer que toute fonction en escalier f prenant sur 
les ensembles 


E,, Es, ..., En (U E;=X, Eif£;=@ pour izj) 
i—1 


respectivement les valeurs 


Us Y2s + + +, Un 


(où tous les y; sont des nombres rationnels) peut être approchée 
au sens de la métrique de Z, avec la précision que l’on veut par des 
fonctions de la forme (5). Compte tenu de la remarque faite plus 
haut, on peut supposer, sans restreindre la généralité, que la base 
de la mesure Lu est un anneau. 

D'après la définition 2, quel que soit £ >> 0, la base dénombrable 
de la mesure u contient des ensembles À4;, A», ..., A, tels que 


u (ErAA x) < E. 
Posons 
An = Ag X U À; (k=1, 2,...,n) 
ik 


et 
Yr pour xE Ah, 


fUR)= O pour zERN Ü Ai. 
i=1 


Il est aisé de voir que pour £& suffisamment petit la mesure 


u {if (x) Æ f* (a)) 


devient aussi petite que l’on veut. Par conséquent, l'intégrale 
À LÉ)" (1 du < (max | y |) n fe : f (e) € f° (a) 


est aussi petite que l’on veut, si & est suffisamment petit. 

En vertu des suppositions faites par rapport à la base de u, la 
fonction f* est de la forme (5). 

Le théorème est démontré. 

Dans le cas particulier, où X est un segment de la droite numéri- 
que et la mesure u est celle de Lebesgue, on peut obtenir un ensemble 
dénombrable et partout dense dans Z; d’une manière plus simple, 
par exemple, en prenant l’ensemble de tous les polynômes à coeffi- 
cients rationnels. En effet, cet ensemble est partout dense dans l’en- 
semble des fonctions continues (même au sens de la convergence 
uniforme) et ce dernier est partout dense dans L; (X, u). 
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$ 2. L’espace 7» 


1. Définition et propriétés fondamentales. L'espace Z; est, comme 
nous l’avons vu, un espace vectoriel normé complet (c.-à-d. un 
espace de Banach). Pourtant il n’est pas euclidien: la norme dont 
il est muni ne peut pas être définie à l’aide d’un produit scalaire. 
Ceci résulte du « théorème du parallélogramme », établi au n° 8, 
$ 4, chap. III. Par exemple, pour les fonctions f = 1 et g — sin x, 
intégrables sur le segment [0, 2x], la relation 


Pf + 8 + 8 =2 (7 + 1e 


n'est pas vérifiée dans Z,. 

Un espace fonctionnel non seulement normé, mais aussi eucli- 
dien, peut être construit, en considérant l’ensemble des fonctions à 
carré intégrable. Introduisons les définitions correspondantes. Nous 
allons considérer d’abord des fonctions réelles f, définies sur un 
espace X sur lequel est donnée une mesure u. Toutes les fonctions 
sont supposées mesurables et définies presque partout sur X. Les 
fonctions équivalentes entre elles ne sont pas considérées comme 
distinctes. 

Définition 1. Une fonction f est dite fonction à carré in- 
tégrable sur X, si l'intégrale 


| F (du 


existe (est finie). Nous désignerons l’ensemble de toutes les fonctions 
vérifiant cette condition par L, (X, u) ou, plus brièvement, par L:. 

Etablissons les propriétés fondamentales des fonctions à carré 
intégrable. 

1. Le produit de deux fonctions à carré intégrable est une fonction 
intégrable. 

Ceci résulte immédiatement de l'inégalité 


HORCIESARCETAC) 


et des propriétés de l’intégrale de Lebesgue. 
Corollaire. Toute fonction f à carré intégrable sur un espace 
de mesure finie est intégrable. 
En effet il suffit de poser g (x) = 1 et d'utiliser la propriété 1. 
2. La somme de deux fonctions de L, est aussi une fonction de L:. 
En effet, 


(x) + g GG) < PF () +217 (x) g (x) | + & (x); 
d’après la propriété 1, chacune des trois fonctions figurant au second 


membre de cette inégalité est intégrable. 
3. Si fE L: et « est un nombre quelconque alors af € La. 
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En effet, sif € L,ona 
| lof (a) du = 0? À f(x) du < 0. 


Les propriétés 2 et 3 expriment le fait que toute combinaison linéai- 
re de fonctions de L, appartient encore à L:. En outre, il est évi- 
dent que l’addition des fonctions de ZL, et leur multiplication par 
des nombres vérifient toutes les conditions énumérées dans la défi- 
nition de l’espace vectoriel (chap. III, $ 1). Par conséquent, l’en- 
semble L, des fonctions à carré intégrable est un espace vectoriel. 
Définissons maintenant le produit scalaire dans L», en posant 


G, 8)= | f(x) (x) du. 


Il est clair que toutes les conditions indiquées dans la définition 
du produit scalaire (cf. $ 4, chap. III), à savoir: 

2) (fa + Jos 8) = (1: 8) + Fa 8); 

x (af, g) — à (f, g), 

4) (7, ÿ) > 0, si f 0, 
sont vérifiées. En particulier, la condition 4) est vérifiée, grâce à la 
convention de ne pas considérer comme distinctes les fonctions 
équivalentes l’une à l’autre (de cette façon, en qualité d’élément nul 
on prendra l’ensemble des fonctions sur X, équivalentes à f = 0). 

Ainsi donc, en définissant pour les fonctions à carré intégrable 
les opérations d’addition et de multiplication par un nombre, ainsi 
que le produit scalaire, on est conduit à la définition définitive 
suivante. 

Définition 2. On appelle espace euclidien L;: l’espace 
vectoriel ayant pour éléments les classes des fonctions équivalentes 
à carré intégrable et muni du produit scalaire 


G, 8)= | f(x) e(x) du. 


Dans Z», comme dans tout espace euclidien on a l'inégalité 
de Cauchy-Bouniakovsky et l'inégalité triangulaire qui dans ce 
cas ont respectivement la forme 


V Ste ausy | F6 dut | a (x) du. 


En particulier, pour u (X)  œ, en posant dans l'inégalité de 
Cauchy-Bouniakovsky g (x) = 1, on obtient l'estimation utile 


et 
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suivante : 

({ du) <n (0 | P() du. (1 
La norme sur Z, est définie par la formule 

= 1-7 | Pau; 


la distance de deux éléments f et g de ZL, est définie par la formule. 


PU D=If—el=p | Ce ()dn. 
La quantité 


| G@)— (a) du=|f if 


s'appelle encore écart quadratique moyen des fonctions f et g. 

La convergence d’une suite de fonctions au sens de la métrique: 
de l’espace L: s'appelle convergence en moyenne quadratique. Si une. 
confusion de cette convergence avec la convergence dans Z;, définie: 
au paragraphe précédent, n’est pas possible, nous employerons dans. 
ce cas aussi le terme plus court « convergence en moyenne ». 


Théorème 1. Siu(X) < oc, l’espace L: (X, u) est complet. 


Démonstration. Soit {/,} une suite de Cauchy dans. 
Lo, c.-à-d. 


IL fn — fmll—- 0 quand 7, m—- 0. 


Alors, en vertu de l'estimation (1), on a 
À Lin (&) — fm (a) |du Sn CON {À fn (2) — fm (du } 2 


<efu(X)]/2, (2) 


ce qui signifie que {f,} est une suite de Cauchy pour la métrique 
de l’espace L;, également. En recommençant les raisonnements que: 
nous avons usés pour démontrer la complétude de l’espace L;, choi- 
sissons dans {/,} une sous-suite {f,,} convergeant presque partout 
vers une fonction f. En vertu du théorème de Fatou, dans. 
l'inégalité 


| ny (&)— fn, (æ)) du <e, 


vraie pour les termes de cette sous-suite, si £ et { sont assez grands... 
on peut passer à la limite pour { — oc. On obtient alors 


À Gr, G@)—f (a dure, 
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d’où l’on déduit que jf € L: et que f,, — f. Pour achever la démons- 


tration, il suffit, comme dans la démonstration du théorème 1, 
$ 1, d'utiliser le fait que si une suite de Cauchy contient une sous- 
suite convergente, elle converge vers la même limite. 

2. Cas d’un espace de mesure infinie. Dans le numéro précédent 
nous avons étudié des fonctions à carré intégrable, définies sur un 
espace À de mesure finie. Lors de cette étude nous nous som- 
mes basés effectivement sur la condition u (X) ©: nous avons 
fait appel à cette condition d’abord pour démontrer que toute fonc- 
tion à carré intégrable est intégrable et ensuite pour démontrer 
l'inégalité (2), sur laquelle est fondée la démonstration du fait que 
l’espace Z>» est complet. Si l’on considère des fonctions définies sur 
un espace de mesure infinie (par exemple, sur la droite numérique 
avec la mesure de Lebesgue), une fonction appartenant à L, n'ap- 


. 2 . N . { 
partient pas nécessairement à Z:. Par exemple, la fonction 7 
T 


n’est pas intégrable sur la droite numérique toute entière, bien que 
son carré soit intégrable. D'autre part, dans le cas où u (X) © 
on a l'inégalité (1) qui signifie que la convergence d’une suite de 
fonctions dans Z, implique sa convergence dans Z,. Pour u (X) — oo 
cela n’est plus vrai: par exemple, la suite des fonctions 


0 @=} _ pour [x|<, 
A (x) = 
O0 pour |x|l>n 


converge vers O0 dans l’espace Lo (— ©, o) des fonctions à carré 
sommable sur la droite numérique et ne converge vers aucune limite 
dans L, (— oc, oc). Cependant, le théorème de la complétude de 
l'espace L: reste vrai pour u (X) — oo !). 

Démontrons cette assertion. Comme dans le n° 6, $5, chap. V,où 
l’on a introduit la notion d’intégrale sur un ensemble de mesure 
infinie, nous allons supposer que l’espace X peut être représenté 
par une réunion dénombrable d’ensembles de mesure finie. Soit 


X= U Xn H(Xn) 00, Xn1Xm= 
pour nz=m 


une telle représentation, et soit {f,} une suite de Cauchy dans 
L; (X, u). Alors pour tout e > 0 il existe V tel que 


À Un Ce) — fe (@)P du < 8 


1) La démonstration de la complétude de l’espace L4, exposée au $ 1, ne 
dépend évidemment pas de l’hypothèse que la mesure de l’espace X est finie. 
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pour tous les 4, ! > N. Posons 
X 
men { V9 Pour 2EXr 
0 pour les autres x. 


En vertu de l’additivité dénombrable de l'intégrale de Lebesgue, 
on à 


iQ) D | UE (1 au <e. 
n=1 Àn 


Donc, pour tout M fini on a, à plus forte raison, 
M 


D À A (0) — A" (OP du < 8. G) 
n=1i XÀn 


D! 


L'ensemble des fonctions à carré intégrable sur chaque X, est un 
ensemble complet. En posant 


F9 (x) = lim fi (x) 


{au sens de la convergence dans l’espace L, (X,, u)), on peut passer 
dans l'inégalité (3) à la limite pour ! — oc. On obtient alors 
M 


5 [A1 Gr auce. 
n=1i Zn 


Comme cette inégalité est vraie pour tous les M7, on peut passer 
à la limite pour ] — co. Ceci conduit à l'inégalité 


OO 


2 | LÉ (0) —f9 (Pure. 
n=1 Xn 
En posant 


f(x)=f" (x) pour zEX», 


on peut récrire celte inégalité sous la forme 
| Un ()—1 GP due. 


On en déduit que f € L, (X, u) et que la suite {/,} converge vers f. 

Exercice. On définit Ly,(X, u) comme l’ensemble des classes de 
fonctions équivalentes, pour lesquelles | f (x) (du << œo où 1 p < 0. 
Démontrer que L, (X, u) est un espace de Banach relativement à la norme 


IF = (| OR a" 


380 ESPACES DE FONCTIONS SOMMABLES [Ch. VII 


3. Ensembles partout denses dans Z,. Théorème de l’isomor- 
phisme. Ainsi, l’espace Z, (X, u) des fonctions à carré intégrable 
est un espace euclidien complet. A l’exception des cas de 
dégénérescence, la dimension de cet espace est infinie. Pour diver- 
ses applications en analyse, il importe de savoir, à quelles conditions 
l’espace Lo (X, u) est séparable, c.-à-d. contient un ensemble 
dénombrable partout dense. Au $ 1 nous avons montré que l’espace 
Li (X, u) est séparable, si la mesure u a une base dénombrable. 
Il est aisé de voir que cette condition assure également la séparabilité 
de L, (X, u). En effet, toute fonction de L, (X, u) peut être appro- 
chée avec la précision que l’on veut par des fonctions dont chacune 
est nulle en dehors d’un certain ensemble de mesure finie !). Or, 
les mêmes raisonnements que dans la démonstration du théorème 3, 
$ 1, montrent que dans l’ensemble de telles fonctions on peut choisir 
un sous-ensemble dénombrable partout dense. 

Ainsi, lorsque la mesure u a une base dénombrable, Z, (X, u) 
est un espace euclidien complet et séparable. Autrement dit, en 
laissant de côté le cas où ZL2 (X, u) est de dimension finie, on ob- 
tient le résultat suivant: si la mesure u a une base dénombrable, 
Lo (X, u) est un espace de Hilbert séparable. 

En vertu du théorème de l’isomorphisme des espaces de Hilbert, 
cela signifie que tous les espaces L: (X, u) possédant la propriété 
en question sont isomorphes entre eux. En particulier, chacun de 


D 


ces espaces est isomorphe à l’espace _des suites numériques 


Z = (Xy, Lo, +. ., En, . . .) telles que > x << oo. Ce dernier 


espace peut être considéré comme Le: (X, mi où X est un ensemble 
dénombrable, la mesure u est définie sur tous ses sous-ensembles 
et vaut 1 pour chaque point. Dans la suite nous nous bornerons aux 
espaces L, (X, u) tels que la mesure up soit à base dénombrable. S'il 
n’y a pas d’ambiguité possible, nous désignerons un tel espace 
simplement par L:. 

Comme, d’après ce qui précède, L, est la réalisation d’un espace 
de Hilbert, toutes les notions et tous les résultats, établis au $ 4, 
Chap. IIT, pour un espace de Hilbert abstrait, s'étendent à L>. 

En particulier, d’après le théorème de Riesz, toute fonctionnelle 
linéaire sur un espace de Hilbert Æ s’écrit sous la forme d'un pro- 
duit scalaire 

F(h) = (h, a), 

où a est un vecteur fixé de 7. Par conséquent, foute fonctionnelle 
linéaire sur L; est de la forme 


F(P= | j (ae (x) du, 


où g est une fonction fixée à carré intégrable sur XX. 


1) Lorsque u (X) < ©, cette opération est superîflue. 
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4. Espace L, complexe. Nous venons de considérer l’espace Z, 
réel. Les résultats exposés plus haut s'étendent sans difficulté au 
cas d’un espace complexe. Une fonction complexe f, définie sur 
un espace X, sur lequel est définie une mesure u, s'appelle fonction 
à carré intégrable, si l'intégrale 


| 17) Pau 


X 


est finie. Si l’on définit l'addition de telles fonctions et leur multi- 
plication par des nombres comme d'habitude et le produit scalaire 
par la formule 


9 = | (0 81 du, 


X 


on obtient un espace euclidien que l’on appelle espace L, complexe. 
(De même que dans le cas réel, nous considérons ici toutes les fonc- 
tions équivalentes entre elles comme le même élément de l’espace.) 
Cet espace est complet et si la mesure u a une base dénombrable, 
il est aussi séparable. Aïnsi donc (le cas de la dimension finie étant 
laissé de côté), on a le résultat suivant : l’espace L, complexe cor- 
respondant à une mesure à base dénombrable est un espace de Hilbert 
complexe séparable. Tous les espaces de ce type sont isomorphes entre 
eux et jouissent de toutes les propriétés établies au $ 4, chap. III. 
9. La convergence en moyenne quadratique et sa liaison avec 
d’autres types de convergence des suites de fonctions. En introduisant 
la norme dans l’espace Z», par là même nous avons défini pour les 
fonctions à carré intégrable la notion de convergence suivante: 


În — J; 


si 
lin | fn (x) —f ()l du = 0. 


Cette convergence a été appelée convergence en moyenne quadrati- 
que. On se propose maintenant de trouver la liaison de cette conver- 
gence avec d’autres types de convergence des suites de fonctions. 
Considérons d’abord le cas où l’espace X est de mesure finie. 

1. Si une suite {f,} de fonctions de l'espace L, (X, u) est conver- 
gente pour la métrique de L: (X, u), elle est convergente aussi pour 
la métrique de L; (X, u). 
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En effet, grâce à l'inégalité (2), on a 
1/2 


LG) (due 0 À En (fard |" 


d’où notre affirmation. 

2. Si une suite {f,} est uniformément convergente, elle est aussi 
convergente en moyenne quadratique. 

En effet, pour tout € => 0 et pour tous les » suffisamment grands 
on à 


et donc 


À Un (e)—f (&)P du < en (X), 


d’où l’on déduit l'affirmation annoncée. 

3. Si une suite de fonctions sommables {f,} est convergente en 
moyenne, elle est aussi convergente en mesure sur X. 

Cette assertion résulte immédiatement de l'inégalité de Tché- 
bychev (page 293). 

De là et du théorème 8, $ 4, chap. V, on déduit la proposition 
suivante : 

4. Si une suite {f,} est convergente en moyenne, on peut en extraire 
une sous-suite Un, convergente presque partout. 


Notons que nous avons déjà établi ce résultat lors de la complé- 
tude de l’espace ZL;, sans utiliser le théorème 8, $ 4, chap. V. 

Il est aisé de voir que la convergence d’une suite en moyenne 
(et même en moyenne quadratique) n’implique pas, en général, sa 
convergence presque partout. En effet, la suite {f,} construite au 
n° 6, $ 4, chap. V, converge en moyenne (et même en moyenne 
quadratique) vers f = 0 et néanmoins, comme nous l’avons vu, 
elle ne converge vers 0 en aucun point. Inversement, une suite {f,} 
peut être convergente presque partout (et même partout) sans tou- 
tefois être convergente en moyenne. Considérons, par exemple, la 
suite {f,} de fonctions sur le segment [0, 1] telle que 


nf" ve 2(0 2] 


O pour les autres x. 


Il est évident que f, (x) — 0 pour tous les x € [0, 1]. Tout de même, 


1 
| [fn(æ)|dæ=1 pour tous les 7. 
0 
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La liaison entre les différents types de convergence dans le cas 
u (X) << oo peut être exprimée sous la forme du schéma suivant : 


CON VERGENCE 
UNIFORME 


CON VERGENCE EN CON VERGENCE 
MOYENNE QUADRATIQUE (Lo) PRESQUE PARTOUT 


CONVERGENCE EN CON VERGENCE 
MOYENNE (Li) EN MESURE 


où la flèche pointillée indique la possibilité d'extraire d’une suite 
convergente en mesure une sous-suite convergente presque partout. 

Dans le cas u (X) — oo (par exemple, pour les fonctions défi- 
nies sur toute la droite numérique, la mesure sur cette droite étant 
celle de Lebesgue) les liaisons établies ci-dessus n’ont plus lieu. 
Par exemple, la suite 


1 pour [x|< n, 
fn()= À Vr 
O0 pour [x|>n 
converge uniformément sur toute la droite numérique vers f = 0 
et pourtant elle ne converge ni en moyenne, ni en moyenne quadra- 
tique. En outre, comme nous l’avons déjà indiqué, pour u (X) — 
la convergence d’une suite en moyenne quadratique (c.-à-d. dans 
L;) n'implique pas la convergence de cette suite en moyenne (c.-à-d. 
dans L;). 
Remarquons enfin que ni pour u (X) ©, ni pour u (X) — o, 
la convergence en moyenne n'implique pas, en général, la convergen- 
ce en moyenne quadratique. 


$ 3. Systèmes orthogonaux de fonctions dans L:. 
Séries par rapport à un système orthogonal 


Les théorèmes généraux, établis au $ 4, chap. III, pour les espa- 
ces euclidiens, montrent que dans Z il existe des systèmes orthogo- 
naux complets (en particulier, des systèmes orthonormés) de fonc- 
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tions. Un tel système peut être obtenu, par exemple, en appliquant 
à un système complet de fonctions le procédé d’orthogonalisation 
décrit au même endroit. Si un système orthogonal complet {,} 
est choisi dans L», tout élément f € L2 peut être considéré conformé- 
ment aux résultats généraux du $ 4, chap. III, comme la somme de 
la série de Fourier de la fonction f par rapport au système orthogonal 


{Pr} : _ 
Î _ 2 np 


Les coefficients c,, c.-à-d. les coefficients de Fourier de la fonction 
f par rapport au système {œ,}, sont définis par les formules 


On = TE | Ï (x) Pn (x) du (en À Pn (x) du) 


Dans ce paragraphe nous considérerons les exemples les plus usuels 
de systèmes orthogonaux dans L, et les développements qui leur 
correspondent. 

1. Système trigonométrique. Série trigonométrique de Fourier. 
Considérons l’espace L, [— x, x] des fonctions à carré intégrable 
sur le segment [— x, x], la mesure sur ce segment étant la mesure 
habituelle de Lebesgue. Dans cet espace les fonctions 


Î, cos nx, sinnx (n — 1, 2, ...) (1) 


forment un système orthogonal complet, dit système trigonométrique. 
L'orthogonalité est facile à vérifier par calcul direct ; par exemple, 
pour Am On a 

A 


sT 
| cos næ cos mr de = | | cos us + cos x | dx —0, 


— IT — I 
etc. La complétude du système (1) résulte du théorème de Weierstrass 
sur l’approximation d’une fonction périodique continue quelconque 
par des polynômes trigonométriques !). Le système (1) n’est pas 
normé. Le système normé correspondant est constitué par les fonctions 
Î COS nt sin nx 

T— =— » = n — À, 2, s..). 

V/2x Vx Va ( ) 
Soit f une fonction de L: [— x, xl; ses coefficients de Fourier par 
rapport aux fonctions À, cos nx, sin nx sont désignés usuellement 


a Lé Lé Ld 
ar a, et b,. Donc, conformément aux formules générales pour 
P n n 


0 
9 


1) Au $ 2, chap. VIII, nous démontrerons le théorème de Fejér qui est un 
renforcement du théorème de Weierstrass. De cette façon nous obtiendrons en 
même temps une démonstration de la complétude du système trigonométrique 
(indépendante, bien sûr, des résultats exposés ici). 
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les coefficients de Fourier, on a 


LA LA 
1 N 1 
Reg |f(de, cd. a+ | f(odr 
TH — 


et 


—, à 


An = — | { (x) cos nx dx, bn = — 
I x 


f (x) sin nx dx. 


La série de Fourier correspondante est 


ee) 
_ +, (ancosntz+b,sinnx) 


n—=1 


et, quelle quesoït la fonction f € L>, elle converge en moyenne quadra- 
tique précisément vers cette fonction. Si 


ñn 
Sn (x) = + S\ (ax cos kx + bx sin kx) 


R=1 


est une somme partielle de la série de Fourier, l’écart quadratique 
moyen de S, et f peut être calculé à l’aide de la formule 


o n 
If (a) — Sn PSP n (<Si+ D (aè+6t)). 
k=1 
Parmi tous les polynômes trigonométriques de degré nr 
Ta (x) = _ + > (ax cos kx + BP, sin kx) 
k=—1 


la somme partielle de la série de Fourier S, fournit la meilleure 
approximation de la fonction f (pour la métrique de L:). L’inégalité 
de Bessel pour le système trigonométrique a la forme 


[o,) TI 
2 2 1 
HD Gi+0<T | Fc) des 
n=1 TH 


mais, comme le système trigonométrique est complet, pour toute 
fonction de L, on a en réalité la relation de Parseval 


HS += | (de. 
n=1 — TH 


25—0167 
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Quelle que soit la fonction f € L>, les carrés de ses coefficients de 
Fourier forment une série convergente. Réciproquement, si les 
nombres &@o, An, bn n — 1, 2, ...) sont tels que la série 


O0 
D, (a + bà) est convergente, alors la série 
n—=1 


+ © (ancosnx+bAsinnx) 


n=1 


est aussi convergente (dans L,) et sa somme est une fonction dont 
les coefficients de Fourier coïncident avec les nombres ap, 4», bn. 

Toutes ces propositions (qui découlent immédiatement des 
résuliats généraux du $ 4, chap. III) s'étendent facilement aux 
fonctions définies sur un segment de longueur aribtraire [— Z, ll]. 
Si f est une fonction à carré sommable sur [— {, {]}, le changement 


. . l = 
de variable x — T. soit é — _ conduit à remplacer f (t) par la 


fonction f* (x) — f (=): définie sur le segment [— x, xl. 
On en déduit que 


an= | f@cos ad, n—0, 1, … 


—1 
et 


l 
1 . t 
bu=+ | f (6) sin dt, n = 1, 2, ….. 
l 


La série de Fourier pour une fonction jf, définie sur un segment de 
longueur 2!, a donc la forme 


O0 
ao nTi .. nl 
+ > (an C0 + bn sin) . 
n=1 


Remarques. 1. Les séries trigonométriques ont été uti- 
lisées par le mathématicien français J. Fourier dans ses travaux sur 
la physique mathématique et plus particulièrement sur la propaga- 
tion de la chaleur. Par ailleurs, les formules servant à calculer les 
coefficients a, et b, étaient connues déjà à Euler. Par la suite la 
théorie des séries trigonométriques a été développée dans les tra- 
vaux de Riemann, Dirichlet, etc. Primitivement les termes « série 
de Fourier », « coefficients de Fourier », etc., furent employés uni- 
quement pour le cas du système trigonométrique et ce n'est que 
beaucoup plus tard qu’on commença à les utiliser au sens général, 
décrit dans le $ 4, chap. III (c.-à-d. pour un système orthogonal 
arbitraire dans un espace euclidien quelconque). 
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2. Du fait que le système trigonométrique est complet et des 
théorèmes généraux du $ 4, chap. III, il résulte que pour toute 
fonction f € L, sa série de Fourier 


CO 


_ + ÿ, (an cos rx + b, sin nx) 


n=1 


converge vers cette fonction en moyenne. Mais pour des problèmes 
concrets de l’analyse il importe de savoir les conditions qui assurent 
d’autres types de convergence de cette série vers f, par exemple, la 
convergence en chaque point ou la convergence uniforme. Les ques- 
tions de ce genre seront étudiées au chapitre suivant. 

2. Systèmes trigonométriques sur le segment [0, x]. Les fonctions 


1, cos x, cos 2x, ... (2) 


et 
sin x, Sin 2x7, ... (3) 


forment dans leur ensemble un système orthogonal complet sur le 
segment [— x, x]. Montrons que chacun des deux systèmes (2) 
et (3) est orthogonal et complet sur le segment [0, x]. L’orthogonalité 
peut être vérifiée par calcul direct. Démontrons la complétude 
du système (2). Soit f une fonction à carré intégrable sur [0, xl. 
Achevons de définir cette fonction sur le segment [— x, x], en 
posant pour z E[— x, 0) 


et développons-la en série de Fourier par rapport au système 
1, cos nx, sin nx (n — 1,2, ...). 


Comme la fonction f, définie maintenant sur [— x, x], est paire, 
tous les coefficients des sinus dans ce développement sont nuls. 
Cela se voit aussitôt, si l’on considère la formule servant à calculer 
ces coefficients : pour une fonction paire f et pour nr > 4 on a 


T 0 TT 
| f (a) sin na dx = | f (x) sin nx dx + | (a) sin na da = 
Tl 0 


— I 


= | f(xz)sinnzdr+ | f(x) sin nx dx 0. 


Of 
OS à 


En d’autres termes, sur le segment [— x, x] (et à plus forte raison 
sur [0, xl) cette fonction peut être approchée en moyenne quadrati- 


25* 
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que avec la précision que l’on veut par des combinaisons linéaires 
des éléments du système (2). On en déduit que le système (2) est 
complet. La complétude du système (3) sur [0, x] peut être démontrée 
de manière analogue, moyennant un prolongement impair de la 
fonction f, définie sur [0, xl, à l'intervalle semi-fermé [— x, O0) par 
la formule 


f(— a) = — f(@). 


La fonction sur [— x, x], obtenue à la suite d’un tel prolongement, 
est impaire et admet sur ce segment un développement ne contenant 


que des sinus. 
3. Série de Fourier sous forme complexe. L'écriture d’une série 


trigonométrique peut être condensée, si l’on fait usage des formules 
d’Euler 


einx + erinx . einx __ p—inx 
COST — 2 — et Sin nx — TX 


En portant ces expressions dans la série de Fourier, on obtient 


++ > (an cos nx + b, Sin nx) — 
n—=1 


einx — erinx | 


__ ue einx L e—inx | 
= RHD (an EE — id TE — 


OO O0 
__ un \ An —ÜÙn inx , N\ An tibn -inx _ inx 
td rs RS D ee, 


n=1 n={ n= — 00 


« a 
où Co—= + et pour n > 


2 
An —ib 
Cn = — 5 ln 
An + ibn (3) 
Con — 9 
L'expression 
æe e 
>» Cnet"* 
N=—=— 00 


s'appelle série trigonométrique de Fourier sous forme complexe. Les 
coefficients c, de cette série s'expriment par a, et b, à l’aide des 
égalités (4); mais il est facile d'établir aussi des formules directes 
pour ces coefficients. En effet, un calcul immédiat montre que 


T 
| ex er tmnx d= | 


— I 


0 pour n:£m, 
21 pour n = m. 
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C'est pourquoi, en multipliant l'égalité 


O0 


j(a)= 2 Cne"* (5) 
par evimx (m — 0, + 1, +2, ...) et en intégrant, on obtient 
ELA 
| f(x)e TT dx = 2ncm, 
7% 
c.-à-d 
{ fe ; 
Cm = 5e | f{x)e "dx (m—0, +1, +2, ...). (6) 
—T 


Le développement (5) est valable également pour les fonctions 
complexes à carré intégrable sur lesegment [— x, x]. Autrement dit, les 
fonctions e** forment une base de l’espace L: [— x, x] des fonc- 
tions complexes ayant le carré du module intégrable sur le segment 
[— x, xl. Dans cet espace complexe les expressions (6) représentent 


les produits scalaires de f par eï”x. 
nIT 


En remplaçant les fonctions e”* par et”, on peut étendre 
tout ce qui a été dit plus haut à l’espace L, [— 1, {] des fonctions 
complexes sur un segment de longueur arbitraire 21. 

4. Polynômes de Legendre. Les combinaisons linéaires des fonc- 


tions 
A, zx, x, ... (7) 


donnent l’ensemble de tous les polynômes. Par conséquent, le 
système (7) est complet dans l’espace Z, des fonctions sur un segment 
quelconque !). En orthogonalisant le système (7) sur le segment 
[—1, 1] relativement au produit scalaire 
1 
Ga | f(a)e(ode, 


1 
nous obtiendrons un système orthogonal complet 
Qo (x), Q; (x), Q2 (x), . 


où Q@, est un polynôme de degré n. Montrons que chacun des poly- 
nômes Q, (x) coïncide, à un facteur constant près, avec le polynôme 


dn 
Ra(r)= (a — 1). 


1) La complétude du système des polynômes dans l’espace L2 [a, b] des 
fonctions à carré intégrable sur un segment quelconque [«, b] découle du théorè- 
me de Weierstrass sur l’approximation uniforme d’une fonction continue sur un 
segment par des polynômes. Cf. n°2, $ 2, chap. VIII. 
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En effet, premièrement, le système {R, } est orthogonal. Soit n > m. 
Comme 


d_ (y = à (y = 0 
dzÀ x——1 dxh x——1 
pour tous les # — 0, 1, ..., n — 1, en intégrant par parties, on 


obtient 

1 

| Rm(x) Rn(x) dx — 
1 


dmt+i 
mr (et 1) (at — 1)" = 


| 
me) Là 


1 
min 
(0 [Een] (1) ar 
—1 
Si m < n, l'expression figurant sous le dernier signe d’'intégra- 
tion est identiquement nulle, ce qui prouve que le système {R;,} 
est orthogonal. 
Deuxièmement, il est clair que le polynôme R, est de degré 
n, C.-à-d. que chaque À, appartient au sous-espace engendré par les 
n + 1 premiers éléments du système (7). Ainsi, les systèmes {R,} 
et {Q,} jouissent tous les deux des propriétés suivantes: 
4) ils sont orthogonaux, 
2) le n-ième élément du système appartient au sous-espace 
engendré par les éléments 1, x, . .., a”, 
Or, ces deux propriétés définissent chaque élément du système 
à un facteur numérique près (cf. théorème 1, $ 4, chap. III). Cher- 
chons maintenant les facteurs normalisants des polynômes R, (x). 
Pour n — m l'égalité (8) donne 


1 1 

| Rh(x)dz =(—1)" | EE _—_. (x? — 1)" |? — 1)" dx = 

1 1 

(n 1)2. 22n+1 1) 


1 
— (2!) | — a)" de = ET 


Autrement dit, la norme du polynôme R, est égale à n! PV 5 
On en déduit que le système des polynômes 


1 2n +1 
n 1 2n V” 3 — An (x) 


est non seulement orthogonal, mais encore normé. 


1) La dernière intégrale peut être facilement calculée à l’aide des formules 
de récurrence ou par réduction à la fonction bêta. 
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Au lieu de ces polynômes normés on considère d'habitude les 
polynômes définis par la formule 


Pa (x) = 1 an 


Ton en 1)". 


On les appelle polynômes de Legendre, la formule étant appelée 
formule de Rodrigues. Des calculs effectués il résulte que 


1 0 pour 22m, 
| PA(x) Pa (ar=} 


—1 


Gi Pour n=m. 


Voici les expressions explicites des cinq premiers polynômes de 
Legendre : 


P; (x) — 1, 
P: (x) — À, 
5) 1 
Pa(x)= sa, 
Pa(m) = —<À2, 
30 15 3 
Pi(a)= rai + 


Le développement d’une fonction f sur le segment [— 1, 1] 
suivant les polynômes de Legendre a la forme suivante: 


f(x) = 2 CnPn(x), 


où 


Cond 


en ET | f(x) Pa(x)dz. 


— 1 


9. Systèmes orthogonaux dans un produit d’espaces. Séries de 
Fourier multiples. Soient X”’ et X” deux ensembles, sur lesquels 
sont définies les mesures u” et u”. Désignons les espaces des fonctions 
à carré intégrable sur ces ensembles respectivement par Z; et L,. 
Sur le produit 


X=X" x X” 
considérons la mesure 
u=u xp 
et désignons par L, l’espace correspondant des fonctions à carré 


intégrable. Les fonctions de L>, seront considérées comme fonctions 
de deux variables. 
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Théorème 1. Si {Ym} et {W,} sont des systèmes orthonormés 
complets dans L, et L, respectivement, alors l'ensemble de tous les 
produits 


fmn (£, Y) = Pm (&) Ÿn (Y) 
est un système orthonormé complet dans L:. 


Démonstration. En vertu de la remarque concernant 
le théorème de Fubini (n° 4, $ 6, chap. V) on a 


À Fan (as du À gi (æ) ( À 1% Gp au”) du’ 1. 
X x’ x" 


Si m Æ m1, d'après le même théorème on a 


Î fm (&, 9) fans (es 0) du = 
ZX 


= À bn (2) Dm (y) ( | On (2) Pi (x) du’) du’ = 0, 
x” x’ 


car la fonction de deux variables f», (x, y) fman: (& y) est Sommable 
sur À — X" x X”. 
Si Mm— M1, mais AN, On a 


À fmn (X, Y) fmans (X, Y) du = | Pm (T) ( | Yn (Y) Pri (Y) du") du" = 0. 
ï F2 Fa 


Démontrons que le système {fmn} est complet. Supposons que 
dans Z, il existe une fonction f orthogonale à toutes les fonctions 
Îmn. Posons 


FnQ= | f(x y) Em (x) du”. 
À 


« 


Il est aisé de voir que la fonction #,, (y) est à carré intégrable. 
Par suite, la fonction F,, (y) Ÿ\ (y) est intégrable pour tout n. En 
appliquant de nouveau le théorème de Fubini, on obtient 


À Fin) Vn (7) du'= À fe, 9) fmn (&, y) du = 0. 
ZX” X 


Comme le système {W,} est complet, on en déduit que F,, (y) = 0 
pour presque tous les y. Mais alors pour presque chaque y on à 


À 7 (&, 9) Om (a) du” =0, 
L 


quel que soit m. En vertu de la complétude du système {@m}, on 
en déduit que pour presque tout y l’ensemble des x tels que f (x, y) Æ0 
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est de mesure nulle. D’après le théorème de Fubini, cela signifie 
que la fonction f (x, y) est nulle presque partout sur X. 

Le théorème est démontré. 

Appliquons ce théorème à quelques systèmes orthogonaux con- 
crets. Dans l’espace des fonctions de deux variables 


JG, y)(—a<x y <a) 


à carré intégrable un système orthogonal complet est constitué par 
les produits de chaque élément du système 


1, cos mx, sin mx (m = 1, 2, ...) 
par chaque élément du système 

1, cos ny, sin ny (n — 1, 2, ...), 
c.-à-d. par les fonctions 


1, cos mx, Sin mx, Cos ny, Sin ny, COS mx Sin ny, 
COS MI COS ny, Sin MX Sin NY, SIN MX COS ny. 


La série de Fourier correspondante a l’air un peu compliqué, c’est 
pourquoi il est commode d'employer dans ce cas les fonctions expo- 
nentielles 


eimx einu — emxtny) (n, m = 0, +1, +2, ...). 


A cette base correspond la série de Fourier 


f (x, y) — > Cmneimx+nu), 
M, N=—=— 00 
où 
! HA HA 
nn = 5 | | f(x, yhe-itmetnu) Ar dy. 
TH —H 


Dans l’espace des fonctions définies sur le carré 
—1 < LT, < 1, 


les polynômes de Legendre donnent le système orthonormé complet, 
formé par les polynômes 


Qmn (x, y = VEr +0 Enr) dm (x? —- 1)" an (y — 1)". 


mln! 2m+tn+ti dam dyn 


Tout ce qu’on vient de dire s'étend évidemment aux fonctions 
de plusieurs variables. En particulier, la série trigonométrique 
de Fourier d’une fonction de 4 variables a la forme suivante: 


TE EE 0 
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[as ELA 
nn = —— | .… | Î (x, ….., Th) et Ouxgt..Enx) dx: .. dtp. 
(An)? . 
— IT —T 
6. Polynômes orthogonaux par rapport à un poids donné. Nous 
avons obtenu les polynômes de Legendre, en orthogonalisant les 
fonctions 


1, x, x?, ..., a", ... (9) 


relativement au produit scalaire 
1 


À (a) 8 (x) de 


—1 


qui correspond à la mesure habituelle de Lebesgue sur le segment 
[—1, 1]. Soit u une autre mesure sur ce segment, telle que les fonc- 
tions (9) dans l’espace correspondant L: avec le produit scalaire 


1 


| f(x) g(x)du 
1 


soient linéairement indépendantes. Alors en appliquant au système 
(9) le procédé d’orthogonalisation, nous obtiendrons un nouveau 
système de polynômes {Q,} qui dépend en général du choix de la 
mesure u. Supposons que la mesure u soit définie pour les sous- 
ensembles du segment [—1, 1], mesurables au sens de Lebesgue, 
par la formule 


L(E)= | g (x) de, (10) 
E 


où g est une fonction fixée non négative et sommable. La condition 
d’orthonormalité 


Î pour m—n, 


(Om Qn) = 


dans ce cas s'écrit sous la forme 


0 pou mn 


Î pour m—n, 


1 
Î Qn (e)Qn(e)e (a de = | 11) 
_i 


0 pour mn. 


La fonction g, à l’aide de laquelle on définit la mesure (10), est 
appelée poids ou fonction de poids. En ce qui concerne les polynô- 
mes qui vérifient la condition (11), on dit qu'ils sont orthogonaux 
par rapport au poids g. Le choix du poids conduit chaque fois à des 
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nouveaux systèmes de polynômes. En particulier, pour 
1 
T = ns 
g( ) V1—72 


on obtient des polynômes qui coïncident, à un facteur constant près, 
avec les polynômes de Tchébychev 


Th (x) = cos n arccos x (n = 1,2, ...) 
qui jouent un rôle important dans divers problèmes d’interpolation. 


L'orthogonalité de ces polynômes par rapport au poids = 
— x 
est facile à vérifier. En effet, posons 
zx = cos 0, dx — — sin 0d0, V1 — x? — sin 6 


et nous aurons 


1 ñ T 
(rs | co msn 0 = d'à Pour mn; 
_ Vi: 0 O pour mn. 


7. Base orthogonale dans l’espace L, (—c, co). Fonctions 
d'Hermite. Plus haut nous avons considéré des systèmes orthogonaux 
sur un segment, c.-à-d. sur un ensemble de mesure finie. Considé- 
rons maintenant le cas d’un espace de mesure infinie, plus 
précisément, le cas de l’espace Lo (— oo, ©) des fonctions à carré 
intégrable sur toute la droite numérique. Dans cet espace on ne peut 
pas construire un système orthogonal de fonctions à partir des 
polynômes ou des fonctions trigonométriques, car ni les uns ni 
les autres ne lui appartiennent. Il est naturel de chercher « la ma- 
tière » pour construire une base dans L;, (— oo, co) parmi les fonc- 
tions qui décroissent suffisamment vite à l'infini. En particulier, 
une telle base peut être obtenue par orthogonalisation de la suite 

x2 
x'e ©? (n—=0, 1,2, ...). 
En effet, toute fonction de la forme P (x)e 2, où P est un polynô- 
me, appartient évidemment à Le (— oo, œ): la complétude du 
système (12) sera démontrée au n° 3, $ 4, chap. VIII. 
X 


En appliquant aux fonctions ze 2 le procédé d’orthogonali- 
cation, on obtient un système de fonctions de la forme 
x2 


Pn (x) = Hn(x)e 2? (n=0, 1,2, ...), (12) 


où À, est un polynôme de degré n. Ces polynômes s'appellent poly- 
nômes d’Hermite et les fonctions o, s'appellent fonctions d’'Hermite. 
Il est facile de montrer que les polynômes d'Hermite coïncident, 


396 ESPACES DE FONCTIONS SOMMABLES [Ch. VII 


à un facteur constant près, avec les polynômes 


, dre 
drn 


HE (x) =(—1)" ex 


En effet, le polynôme H% est, évidemment, de degré n et la condition 
d’orthogonalité 


| Hi(x) HÉ(z)e-#dx=0 (mn) 


est facile à vérifier par intégration par parties. En vertu du théorème 
de l'’orthogonalisation, il n'existe, à des facteurs constants près, 
x2 


qu'un seul système orthogonal de fonctions de la forme P, (x)e ?, 
où P, est un polynôme de degré n. 

Le résultat obtenu admet encore l'interprétation suivante. 
Considérons sur la droite numérique une mesure u de densité e**, 
c.-à-d. telle que 

du — e-** dx. 


Cette mesure est finie. Dans l’espace des fonctions à carré 
intégrable pour cette mesure, le produit scalaire est défini par la 
formule 


Fa= | fetes; 


les polynômes d'Hermite forment dans cet espace un système 
orthogonal. 

Considérons, enfin, l’espace ZL: (0, oo) des fonctions à carré 
intégrable sur une demi-droite. Prenons dans cet espace le système 
des fonctions 

ate* (n = 0, 1, 2, ...). 


En appliquant à ce système le procédé d’orthogonalisation, on 
obtient le système des fonctions 


L,({x)e”* 


que l’on appelle fonctions de Laguerre. 

Les polynômes correspondants ZL, s'appellent polynômes de 
Laguerre. Les polynômes de Laguerre peuvent être considérés comme 
une base orthogonale de l’espace des fonctions ayant le carré intégra- 
ble sur la demi-droite (0, ) par rapport à la mesure 


du = e*dx. 


Au n° 3, $ 4, chap. VIII, il sera démontré que le système des fonc- 
tions de Laguerre est complet dans Lo: (0, oo). 
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8. Polynômes orthogonaux par rapport à un poids discret. Consi- 
dérons sur la droite réelle n + Î points distincts xzo, Z4, . . ., Zms 
affectés des « poids » Do, Ds «+ + + Pns OÙ p; Sont des nombres posi- 
tifs, et la mesure u est définie par la formule 


u (E) — > Pr: 
XLCE 


Autrement dit, la mesure u (£) est égale à la somme des poids de 
tous les points x, appartenant à Æ. Pour cette mesure « dégénérée » 
tous les ensembles de points de la droite réelle, ainsi que toutes les 
fonctions définies sur cette droite, sont mesurables et tout ensemble 
E qui ne contient aucun point xx (4 — 0, 1, ..., n) est de mesure 
nulle. Dans ces conditions, l'intégrale d’une fonction f sur la droite 
réelle toute entière est égale à 


À f(x) de= Ÿ, paf (ax) 
— 00 k=0 


et le produit scalaire de deux fonctions est défini par la formule 


G, 8)= 2: paf (æx) 8 (æx). 


Il est évident que deux fonctions f et g sont équivalentes par rapport 
à la mesure u si et seulement si 


Î (tn) = 8 (xx) 


en tous les points xZo, Z1, . . ., Zn. 
Dans ce cas trivial le problème de la meilleure approximation 
au sens de la distance sur Z, se réduit à la détermination des sommes 


CoPo + Cia Fe. + + CmPm 


qui rendent minimale l'expression 


m 


> Pr lf (ar) — À cipi (xx), 
kR—0 i=1 


c.-à-d. au problème de « l’interpolation par la méthode des moindres 
Carrés ». 

En partant du problème de l’interpolation par la méthode des 
moindres carrés au moyen des polynômes de degré donné, P. L. Tché- 
bychev a développé la théorie des polynômes orthogonaux. Pour 
exposer les résultats de Tchébychev sur ce sujet, remarquons que 
le système 


1, x, x’, ..., a" (13) 
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est linéairement indépendant pour la mesure choisie u, car le pro- 
duit scalaire (x, x‘) s'exprime par la formule 


n 
(x, z°) = » prai+i 
E=0 
et le déterminant de Gram du système (13) est !) 
D'Pa Dprtr Dipatk +. D Path 


> PRTR > Patk >» PaTR ... D prantt _ 


0 ee + ee ee ee ee ee ee ee ee ee 


D Path D Path DiPRtk te ... D Prtke 
Vo VPi ...Vpr | 


— V’ Poto V pat ce. VW Pnn —_ 


9 9 ee ee + ee + ee + ee ee se 


| Pozs V pix® ... V Pnt? 


nm nn n 
Lo T, . + Tn 


D'autre part, si r > n, x" dépend linéairement des fonctions du 
système (13), car dans notre cas L, est de dimension n + 1. C'est 
pourquoi le procédé d’orthogonalisation conduit à un système fini 
de polynômes 

Po; P, . Ph; 


orthonormés en ce sens que 
ñn 
à PrPr(ær) Ps (tr) = Ôrs 


et tels que chaque fonction f admet le développement en série finie 


Î — > CrPr 
T=0 


avec 
Cr — 2 PrPr(xx) f (tn). 


Aux points x; on a les égalités 


n 


f(x) = À cP,(x») (k=0,1,...,n) 
r=0 


1) Les sommes sont prises sur 4 de 0 à n. 
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è 


autrement dit, la somme complète de la série n’est autre que le 
polynôme d’interpolation de Lagrange. Les sommes incomplètes 
m 


Qm= 2: CrPr (m<n) 


T=0 


sont des polynômes de degré m qui donnent la meilleure approxima- 
tion de la fonction f aux points x; en ce sens que l’expression 


2 pr {f (x) — Qm (xx)}° 
R=0 


est pour @,, moindre que pour tout autre polynôme du même degré m. 


9. Systèmes de Haar, de Rademacher et de Walsh. Considérons un exemple 
de système complet de fonctions sur le segment [0, 1], construit par Haar. Ce 
système est formé par la fonction 

Po = 1 
et les suites 
Pot» 
Pits PA2r 
Pots Paz» P2zs Pass 


(la n-ième suite contient 27 fonctions), où 


HI 0<r<7: 
Poi — 4 
—1, Z <<, 
_ 1 
( V3, 0<r<7, {0 0<r<—, 
| f* 1 1 A Â C2 
Pi = À — | 2; 4 <E<5; P42 — V2, TZ <E <<) 
| - 3 
| 0, TZ <r<1, — V2, z <r<1 
ou, plus généralement, 
2 i—1 i— 1 1 
2” on <r< on + On+1 ? 
2 i— 1 { l 
me — 9 ; on su On+1 < < On , 
i— 1 l 
{ 0, cé On | 
(n = 0, 1, 2, ...,; i= 1,2,..., 2n), 


Il est aisé de voir que le système ainsi construit est orthonormé. Démontrons 
qu'il est complet. 
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Partageons le segment [0, 1] en 2"*1 intervalles égaux A; et considérons 
l'ensemble M, ,1 de toutes les fonctions à valeur constante sur chacun des inter- 
valles A;. Il est évident que M,.1 est un espace vectoriel de dimension 2r+t, En 
outre, toutes les fonctions du système considéré jusqu’à la n-ième suite inclusi- 
vement appartiennent à M,:14. En vertu de l'orthonormalité du système en 
question, les fonctions de ce système sont linéairement indépendantes. Comme, 
en outre, le nombre de ces fonctions est 


n 
14 D 2k—2ntt, 
k=—0 


elles forment dans M, un système complet de vecteurs linéairement indépen- 
dants. Compte tenu du fait que toute fonction continue peut être approchée avec 
la précision que l’on veut par une fonction de M, 41 (pour n suffisamment grand), 
on en déduit que le système considéré est complet. 

Considérons encore un exemple de système orthonormé de fonctions sur le 
segment [0, 1}, dû à Rademacher. Posons 

2x 
Pm=(— 1) |, 

Autrement dit, la fonction ,, s'obtient de la façon suivante: on divise le seg- 
ment [0, 1] en 2" parties égales A; et on attribue à la fonction ,, sur les inter- 
valles A; (i = 1,..., 2m) à tour de rôle les valeurs +1 et —1. 

L'orthonormalité du système 


Pos Pis  * +5 Pro + (14) 


est évidente. Mais ce système n'est pas complet. Ceci résulte, par exemple, du 
fait que la fonction 


4, si O<r<+ ou L <r<t, 
Pi2 — P1P2 — 4 3 
—1À, S1 Z<E<T 


D] 


est orthogonale à toutes les fonctions du système (14). Tout de même, il peut 
être élargi jusqu’à un système orthonormé complet, si l'on lui ajoute les fonc- 
tions de la forme 


Pmym,...m, — Pm,Pm, °…. Pm,, 
(0 mi ma <L'... CM). (19) 


Il est évident que le système ainsi élargi, appelé système de Walsh, reste 
orthonormé. Mais il est en outre complet. La démonstration de ce fait est analo- 
gue à la démonstration de la complétude du système de Haar. 


CHAPITRE VIII 


Séries trigonométriques. 
Transformation de Fourier 


$ 1. Conditions de convergence 
de la série de Fourier 


1. Conditions suffisantes de convergence de la série de Fourier 
en un point. Considérons de nouveau l'espace Z, [—x1, x] des fonc- 
Lions à carré sommable sur le segment [— x, xl. Comme cela a été 
montré au chap. VII, c’est un espace euclidien complet de dimen- 
Sion infinie, C.-à-d. un espace de Hilbert. Les fonctions 


1, cos nx, sin ax (n — 1, 2, ...) (1) 


forment dans cet espace un système orthogonal complet. De ce fait 
pour toute fonction f € L, [— x, nl la série de Fourier 


+ D (a, cos nx + b, sin nx), (2) 


n=1 


LA 


An = = | f(x) cos nx dx, 
TH 
x (3) 
bn = — | f(x) sin nx dx, 
— IT 
converge vers f en moyenne quadratique, c.-à-d. au sens de la métri- 
que de l’espace L, [— x, x]. Cependant, eu égard à l'application 
des séries de Fourier aux problèmes de la physique mathématique 
et à d’autres questions, il est important de savoir les conditions 
assurant la convergence de la série de Fourier vers f non seulement 
en moyenne, mais aussi en un point donné, partout et même unifor- 
mément. Nous établirons ici les conditions suffisantes pour qu’une 
série trigonométrique soit convergente en un point donné. Commen- 
çons par quelques remarques préliminaires. 

Au lieu des fonctions données sur le segment [— x, x] nous 
pouvons parler des fonctions périodiques de période 2x sur la droite 
numérique toute entière, car toute fonction donnée sur un segment 
peut être prolongée périodiquement. D'autre part, les fonctions 
qui constituent le système trigonométrique sont bornées, de sorte 
que les formules (3) définissant les coefficients de Fourier par rapport 
26—0167 
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à ce système ont un sens pour toute fonction somma ble!) (etnon 
seulement pour les fonctions à carré sommable). Donc, à chaque 
fonction f € L, [— x, xl on peut associer ses coefficients de Fourier 
et sa série de Fourier 


f(x) — _. + D (an cos nr + b, sin nx). 


n=1 


Passons maintenant au problème de la convergence de cette 
série en un point donné x vers la valeur de la fonction f en ce point. 
Posons 


Sn(t) = _. + > (ag cos kx + by sin kx). (4) 


R=1 


Modifions d’abord S, (x), en remplaçant dans (4) les coefficients 
ax et b; par leurs expressions intégrales (3). En désignant la variable 
d'intégration par {, nous obtiendrons 


a n 
Sn (x) == | {5+ D (cos kx cos kt +- sin £x sin kt) } dt = 
— TH R=1 
1 f 1 & . . 
mr | i() {5+ Î cos k(1— x) } dt. 
—T R=1 


En utilisant la formule bien connue ?) 


.. on<+t 
; SN — U 
7 + Cosu+cos 2u+ ...“—+cosnu= " ; (9) 
2 sin — 
2 
nous aurons 
. ñ sin LT (t— 2) 
Sn(x)= + | O5 — dt (6) 
LA 2sin 5 


1) Pour une fonction sommable arbitraire, nous ne faisons, bien sûr, aucune 
hypothèse concernant la convergence de la série (2). 
2) Pour obtenir cette formule, il suffit d’additionner membre à membre les 
égalités 


sin Su sin 2 COS u 25] 2 
— —S]n — — LU» In — 
2 2 2 ? 


. + + ee + + ee ee + + + + ee ee + ee ee ee 


—1 .__ u 
u—=Cosnu.2sin —. 
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Cette expression de S, (x), ainsi que ses diverses variantes, s’appel- 
lent intégrale de Dirichlet. 

Effectuons un changement de variable, en posant { — x — 2. 
Comme la fonction figurant dans (6) sous le signe d'intégration est 
périodique de période 2x, l’intégrale de cette fonction sur tout seg- 
ment de longueur 21 a la même valeur. Pour cette raison, en intégrant 
par rapport à la nouvelle variable z, nous pouvons garder les mêmes 
limites: — x et x. Il vient 


n . 2n+1 
1 Sin D) Z 
Sn(x)=-=- | f(x +2) dz. 
7 2sin ST 
La fonction 
1 sin AT z 

D} (z) — On z 
Sin ci 


s’appelle noyau de Dirichlet. De l'égalité (5) on déduit immédiate- 
ment que pour tout nr on a 
JT 
| D, (2) dz= 1. 
7 
À l’aide de cette égalité, écrivons la différence S, (x) — f (x) sous 
la forme 
.. 2n+1 
Sin 


Sn(x)—f(2)= 7% LU +9 ET 


dz. (7) 


Ainsi, nous avons ramené le problème de la convergence de S, (x) 
vers / (x) à celui de la convergence de l'intégrale (7) vers zéro. L'’é- 
tude de cette intégrale est basée sur le lemme suivant. 


Lemme 1. Si la fonction q est sommable sur le segment la, b], 
alors 
b 
lim | (x) sin px dx —(. 


—+> OO 
P a 


Démonstration. Si la fonction œ@ est continûment 
dérivable, à l’aide de l'intégration par parties on obtient que pour 
P —> OO 

b 


|e (x) sin px dx = — qp(x) —— 


a 


cos 


b 
+] PE dr 0. (8) 


26* 
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Soit maintenant @ une fonction arbitraire, sommable sur [a, bl]. 
Comme les fonctions continûment dérivables forment un ensemble 
partout dense dans Z, [a, bl, pour tout & > 0 il existe une fonction 
continûment dérivable , telle que 


Let) vtelar < 4. (9) 
D'autre part, ° 
| | (x) sin pr dz|< 
<| | [op (x) — pe (x)] sin pa dx | +| ®e (x) sin px dx |. 


Le premier terme du second membre est inférieur à . en vertu de (9); 
quant au second terme, il tend vers zéro pour p — oo, comme le 
montre la relation (8). 

Le lemme est démontré. 

Maintenant il est facile de démontrer la proposition suivante 
qui exprime une condition suffisante de convergence de la série 
de Fourier. 


Théorème 1. Si f est une fonction sommable et pour x fixé 
on peut trouver un réel Ô > 0 tel que l'intégrale 


Ô 
f(xz+i)— f(x) 
jHEtA=LE Ja (10) 


existe, alors les sommes partielles S, de la série de Fourier de f conver- 
gent en ce point x vers f (x). 


Démonstration. Ecrivons l'intégrale (7) sous la forme 


T 
L (HERO 2 sn too (11) 
_à 2 


Si la fonction 


est intégrable (par rapport à z) de — Ô à Ô, elle est intégrable sur 
le segment [— x, x] tout entier (car f € L, [— x, xl). Mais alors 
la fonction 
f(&+z)—f(x) 2 
Z 


2 sin + 
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est aussi intégrable; donc, à l'intégrale (11) on peut appliquer le 
lemme 1 qui prouve que cette intégrale tend vers zéro quand n —+ oo. 

Le théorème est démontré. 

Remarques. 1. La convergence de l'intégrale (10) est 
dite condition de Dini. Elle est réalisée, en particulier, si pour x don- 
né la fonction f est continue et admet une dérivée finie ou au moins 
une dérivée à droite et une dérivée à gauche. 

Les raisonnements faits lors de la démonstration du théorème 1 
restent valables, si au lieu de la condition de Dini on exige la con- 
vergence des deux intégrales 
0 ô 

—ÿ 0 
où f (x — 0) et f (x + 0) sont les limites à gauche et à droite de la 
fonction f au point x (on suppose que x est un point de discontinuité 
de première espèce de la fonction f). En effet, la différence 


Su (x) LE+OI (0) 


peut être écrite sous la forme 


0 sin 2n I z 
He +0 —<— + 
—T SIN 7 
! a sin n° z 
++ [+21 (2+0) — ds; 
) 2sin 


si les intégrales (12) existent, ces expressions tendent vers zéro 
quand ñn — oo. 

On en déduit les conditions suffisantes de convergence « globale » 
de la série de Fourier que l’on trouve habituellement dans les cours 
d'analyse. 

Soit f une fonction bornée périodique de période 25 n'ayant que des 
discontinuités de première espèce. Alors si f a en chaque point une déri- 
vée à gauche et une dérivée à droite ?), sa série de Fourier est partout 
convergente et a pour somme f(x) en tout point de continuité et 


+ [f (x + 0) + f (x — 0)] en tout point de discontinuité de f. 


2. Le noyau de Dirichlet D, (z) qui a joué le rôle fondamental 
n+1 


27 


. . 2 , 2 
dans nos raisonnements est une fonction égale à pour z = 


1) Par dérivées à gauche et à droite en un point de discontinuité de première 
espèce on entend respectivement 


lim <E —h)—f(z—0) _. f&+h)—f(z+0) 
h>0+ h-0+ 
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et à oscillations rapides pour n grand (fig. 22). De ce fait, l’apport 


principal à la valeur de l'intégrale 


À (@+2) Dh (a) de 


pour n grand est fourni par un voisinage aussi petit que l’on veut 
du point x. Pour les fonctions vérifiant la condition de Dini cet 
apport tend vers f (x) quand n — œ. Ainsi, on peut dire que les 
noyaux de Dirichlet D, forment une suite de fonctionnelles conver- 
geant, en un certain sens, 
vers la fonction Ô sur l’ensem- 
ble des fonctions f dévelop- 
pables en série de Fourier 
convergente. 

Il est clair que la suite 
{D,} ne converge vers aucune 
limite au sens de la conver- 
gence habituelle; c’est pour- 
quoi lors de l’étude de l’inté- 
grale (7) nous n'avons pas pu 
nous servir des théorèmes 
usuels sur le passage à la li- 
mite sous le signe d’intégra- 
| tion. 

Fig. 22 8. La condition de Dini qui 
assure la convergence de la 
série de Fourier peut être remplacée par d’autres conditions, mais elle 
ne peut pas être simplement omise dans le théorème 1. En effet, même 
pour des fonctions continues la série de Fourier peut être 
divergente en certains points. Il existe des fonctions sommables 
dont la série de Fourier est divergente partout (A. N. Kolmo- 
gorov). En 1915 N. N. Lusin a posé le problème suivant : existe-t-il 
des fonctions de L;, dont la série de Fourier soit divergente sur un 
ensemble de mesure positive? Comme l'a montré L. Carleson 
(en 1966), la réponse à cette question est négative. 

Le fait qu'il existe des fonctions continues dont la série de Fou- 
rier n'est pas convergente en tous les points découle facilement des 
théorèmes généraux sur la convergence faible des fonctionnelles. 
Remarquons tout d’abord que 


LA 
| | Dh (z)|dz — oo, lorsque n— 00. (13) 
F1 


$ 1] CONVERGENCE DE LA SÉRIE DE FOURIER 407 


En effet, le numérateur de la fraction 


sin Po — | 
DA (z)|=— —— 2 
27 sin +. 
est égal à 1 aux points où 
2n +1 1 
5 2= (+) k=0,1,...n. (14) 


Entourons chaque point défini par la condition (14) d’un intervalle 


n° z 2 a|<+: (15) 


La longueur de chacun de ces intervalles est évidemment égale 


x AT , .. 2n +1 { 
à Sn 0 Sur chacun d'eux | sin —— 2 | > T° Evaluons 
la valeur de sin Z sur le k£-ième intervalle (4 = 0, 1,...,n). On a 


2 
ICE Le L (Et +2) ( n +1 ” c Hit. 


On en déduit que l'intégrale de | D, (z) |, prise seulement sur 
les intervalles définis par la condition (15), est plus grande que la 
somme 


1 


n ñn 
1st _ën 15 1 
2 22 7 8x <J k+1* 


ET — "3(2n+1) 

=0 Ont T —0 
Comme cette somme tend vers co quand nr — œ, on a la relation 
(13). Cetie relation traduit le fait que les normes des fonctionnelles 
D, sur l’espace des fonctions continues ne sont pas bornées dans 
leur ensemble. Mais alors, en vertu du théorème sur la convergence 
faible des fonctionnelles, cette suitene peut pas être faiblement 
convergente sur l’espace des fonctions continues, c.-à-d. il existe 
des fonctions continues f pour lesquelles la limite 

JT 


lim | Dh(x)f (x) dx 


a" 


n'existe pas. 

2. Conditions de convergence uniforme de la série de Fourier. 
Nous avons établi les conditions suffisantes pour que la série de 
Fourier d’une fonction f soit convergente en chaque point. La classe 
des fonctions vérifiant ces conditions est assez vaste et même la 
continuité n’est pas nécessaire pour qu'une fonction soit représen- 
table par la somme d’une série trigonométrique partout convergente. 
Il n’en est plus de même, lorsqu'il s’agit des conditions de conver- 
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gence uniforme de la série de Fourier. Il est clair que si la 
fonction f a au moins une discontinuité, sa série de Fourier ne peut 
pas converger uniformément vers f (x), car la somme d’une série 
uniformément convergente de fonctions continues est toujours con- 
tinue. Ainsi, la continuité d'une fonction est nécessaire 
(mais, bien sûr, non suffisante) pour la convergence uniforme de sa 
série de Fourier. 

Une condition suffisante simple est fournie par le théorème 
suivant. 


Théorème 2. Si la fonction périodique f de période 2n est 
absolument continue et sa dérivée f’ appartient à L:[— n, ni, la 
série de Fourier de f converge uniformément vers f (x) sur toute la droite 
numérique. 


Démonstration. Désignons par a, et b, les coefficients 
de Fourier de la fonction f’. Comme la fonction f est absolument 
continue, à l'intégrale 


IT 
an = — | f(x) cos nr dx 
—T 


on peut appliquer la formule de l'intégration par parties. On obtient 


an =— | f(æ) cos nz de = 
—T 
1 1 FR b 
— sinnz | 1 Ô _ __Dn. 
= — f(x) Par Îs (x) sin nx dx — ne 3 
— NH 
de même, 


T 
1 . an 
bn= — | f(x)sinnzda=—+. 
—T 


Par conséquent, 


lOlE S (anl+lènp= lee 


n—i 


Cette série est convergente, car 


| bn | TL r2 +) | an | 1 »9 +) 
n <F(bi+- ? n <3 (a n2 
et > (bÿ + aË) < œ en vertu de l'inégalité de Bessel. La 
n=1 


série numérique (16) est évidemment une série majorante de la 
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série de Fourier de f. Mais alors, d’après le critère de Weierstrass, 
la série de Fourier de jf est uniformément (et absolument) convergente. 
Il reste à montrer que la somme de cette série est f. Soit æ la somme 
de la série de Fourier de f. Alors œ a les mêmes coefficients de Fourier 
que f. Comme les deux fonctions sont continues, on en déduit que 
Î = ®. 

On peut énoncer une autre condition de convergence uniforme 
de la série de Fourier, analogue à la condition de Dini: 


Théorème. Si une fonction sommable f est bornée sur un 
ensemble E © [— x, xl et la condition de Dini est réalisée uniformé- 
ment sur E, c.-à-d. pour tout e >> 0 il existe 0 > 0 tel que 


| ET De+I IA y ee 


pour tous les x € E à la fois, alors la série de Fourier de f converge 
vers cette fonction uniformément sur ËE. 


La démonstration de ce théorème est basée sur le lemme suivant 
qui est un renforcement du lemme 1 (cf. page 403). 


Lemme 2. Si B est un ensemble de fonctions sommables, pré- 
compact pour la métrique de L, [— x, nl, pour tout & >> O0 il existe 
N = Ne) tel que 

b 


| [7 @ sin ad <E 
pour À > N (e) et pour tous les f € B à la fois. 
Pour démontrer ce lemme, prenons dans B un <-réseau fini 


2 
P4s + +. @r et choisissons NV de façon que 


b 
|| @; (£) sin Àf dt <<; i—1,2, ...,k 


pour À > N. Si maintenant f est une fonction arbitraire de B, alors 
pour un certain à on a 


E 
If—pl< 


et, par conséquent, 
b 


| | wsinnal<|| q, () sin M ae] +| | ({—œ)sinhMdt|<e. 
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Le lemme est démontré. 

L'application de ce lemme à la démonstration du théorème 3 
est basée sur le fait facile à vérifier que l’ensemble des fonctions 
Ex (#) = 1&+9 Ï (x) 
est précompact. Les détails de cette démonstration sont laissés 

au lecteur. 

Jusqu'à présent nous avons parlé des fonctions définies sur le 
segment [— x, nl. Il est clair que tout ce qui précède peut être 
automatiquement étendu aux fonctions définies sur un segment de 
longueur arbitraire 21. 

Pour le cas des fonctions de plusieurs variables on peut égale- 
ment énoncer les conditions suffisantes pour que la série de Fourier 
soit convergente en chaque point, de même que les conditions de 
convergence uniforme de la série de Fourier. Nous ne nous étendrons 
pas sur cette question. 


$ 2. Théorème de Fejér 


1. Théorème de Fejér. Soit jf une fonction continue périodique 
de période 2x sur la droite numérique. Elle est définie de façon 
unique par sa série de Fourier 


+ > (an coSnz +b,sinnx). (1) 
n=1 

En effet, si f, et f, sont deux fonctions continues ayant les mêmes 
coefficients de Fourier, la différence jf; — f> est une fonction conti- 
nue, égale à zéro presque partout, donc identiquement nulle. Cepen- 
dant, comme la série de Fourier d’une fonction continue n’est pas 
nécessairement convergente, nous ne pouvons pas obtenir une telle 
fonction j par simple sommation de sa série de Fourier. Une méthode 
de rétablissement d’une fonction continue à partir de sa série de 
Fourier est fournie par le théorème exposé ci-dessous, démontré 

en 1905 par Fejér. 

Soit 
k 

Sx(x)= ++ Y (a; cos jx + b;sin jx) (2) 


j=1 
une somme partielle de la série de Fourier de f. Posons 


On (x)= OT EE. +ûn A (3) 


Les expressions 6, (moyennes arithmétiques des sommes S;) s’ap- 
pellent sommes de Fejér de la fonction f. 
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Théorème 1 (de Fejér). Si f est une fonction continue pério- 
dique de période 21, la suite {o,} de ses sommes de Fejér converge vers 
f uniformément sur toute la droite numérique. 


Démonstration. Utilisons les représentations intégra- 
les des sommes partielles de la série de Fourier, obtenues dans le 
paragraphe précédent : 


! TL sin ET 
Sa (2) =— | f(&+2) — dz. 
2 Sin — 


En portant ces expressions dans l’égalité (3), on obtient pour 02 (x) 
l'expression suivante 


TI 
On(x) = _ | 12 —;— f f(x+2)dz. 
_T — Sin + 
qui peut être réduite à l’aide de la formule !) 
n—1 


D sin (24 + 1) z— sin 


sin z 
k=—0 


à la forme suivante 


cn) ge [| — 2 | + 0 8 @ 


“n\ sn 
appelée intégrale de Fejér. L'expression 


. Z 
SID ñ# — 
{ 2 
D} (2) TT Onn ini (9) 
2 


s'appelle noyau de Fejér. La formule (4) peut s'’écrire sous la forme 


TT 
On(z)= | f(æ+2) Da (a) dr. (6) 
TI 
Il s’agit de démontrer que cette expression tend uniformément vers 
f (x) quand n — æ. Notons préalablement les propriétés suivantes 
du noyau de Fejér: 
1) Da (2) > 0 
ST 
2) | D,z dz= 1, 
2 — TH 
1) Cette formule s'obtient facilement, en sommant sur k les égalités 
2 sin (2k+1)z-sinz—cos 2kz—cos 2(k+1)z. 
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3) pour tout Ô => 0 fixé et n— œ on a 
— Ô TT 

| D} (z) dz = | D; (z) dz = Mn (Ô) —+ 0. 
ô 


TT 


La première de ces propriétés est évidente, la deuxième s’obtient 
de l’égalité (6), si l’on pose f (x) = 1 et l’on tient compte du fait 
que pour cette fonction on a 6, (x) = 1, quel que soit n; enfin, la 
troisième propriété découle immédiatement du fait que si ô << x, 


. _Z 20 , 
alors sin = Z— et, par conséquent, 


| sin n Z \” 
POP: 


Compte tenu de ces propriétés du noyau de Fejér, il est facile de 
démontrer le théorème. Comme la fonction f est continue et périodi- 
que, elle est bornée et uniformément continue sur toute la droite 
numérique. Autrement dit, il existe une constante M telle que 
pour tous les x on a 


[fHI<M (7) 

et pour tout & >> 0 il existe Ô => 0 tel que 
| x” —_ x’ | < ô 
implique 
jf (a)—f(a)1< +. (8) 

Pour la démonstration du théorème il faut évaluer la différence 

IT 

f(x)— on (a) | 1 (a) — f(x +2)1 D (2 dc 
— I 


qui peut être représentée par la somme des trois intégrales suivantes : 
—6 


J_— | (f(x) —f (+ 2)} Da (2) dz, 


TH 
Ô 


Jo= | {f(x)— f(x +2)} D (c) de, 


—Ô 


J4= | (f(x) —f(&+2)} On (2) die 


Ô 
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En vertu de (7) et (8), on obtient immédiatement les évaluations 
suivantes : 


| J_ | < 2Mn, (6), 
| J4 1 < 2Mm (6), 
Ô 
IDI<S [Dd<r. 


—Ù 


Choisissons maintenant nr, de façon que pour n > no et Ô donné 
on ait l'inégalité 


2M nn (6) < + 
Alors 


HOPAOICESES 


comme € est arbitrairement petit, on en déduit l'affirmation du 
théorème. 

Notons que pour démontrer ce théorème nous n’avons utilisé 
que les propriétés 1)-3) du noyau de Fejér. Ceci permet d’obtenir 
diverses généralisations du théorème 1 (cf., en particulier, n° 3 de 
ce paragraphe). 

2. Complétude du système trigonométrique. Théorème de Weier- 
strass. Du théorème de Fejér il résulte que le système trigonométrique 
est complet dans l’espace Z: [— x, xl. En effet, selon ce théorème 
toute fonction continue est la limite d’une suite uniformément 
convergente (et donc, convergente aussi en moyenne) de polynômes 
trigonométriques 6,. Il reste à remarquer que les fonctions continues 
forment un ensemble partout dense dans Z,. Le théorème de Fejér 
peut être considéré comme un renforcement du théorème de Weier- 
strass sur l’approximation des fonctions continues par des polynô- 
mes trigonométriques : ce dernier affirme que pour toute fonction 
continue et périodique il existe une suite de polynômes 
trigonométriques convergeant uniformément vers f, tandis que le 
théorème de Fejér indique une suite bien déterminée 
possédant cette propriété, à savoir la suite des sommes de Fejér (3). 
Du théorème de Weierstrass sur l’approximation uniforme d’une 
fonction continue et périodique par des polynômes trigonométriques 
on déduit facilement le deuxième théorème de Weierstrass, sur 
l'approximation de toute fonction continue sur un segment [a, b] 
par des polynômes algébriques. En effet, si î () est une telle fonction, 


t . 
en posant t=— = TH, C.-à-d. x — i&— a) d La, on obtient une 


fonction œ (t) de t, définie sur le segment [0, x]. Prolongeons cette 
fonction d’abord à l'intervalle semi-ouvert [— x, 0), en posant 
@ (— {) — o (t), et ensuite par périodicité à la droite numérique 
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toute entière. Construisons après cela un polynôme trigonométrique 
T, tel que 


Ta()—POI< SZ pour tous les f. 
Or, tout polynôme trigonométrique peut être développé en une série 


de Taylor uniformément convergente sur tout intervalle fini. Soit 
Ph une somme partielle de la série de Taylor de 7,, telle que 


FAO AUDI pour 0<i< 1. 


Alors 
[p()—Pm(t)|<e pour 0 Li. 
Après le changement de variable inverse t — er n dans P,, (t) 


on obtient un polynôme Q,, (x) vérifiant la condition 
If) —Qm(D 1<e pour a<r<b. 


3. Théorème de Fejér dans l’espace Z;. Dans le théorème de Fejér l’hypothè- 
se et la conclusion sont en quelque sorte symétriques. Du fait que la fonction f 
appartient à l’espace C[—x, x] des fonctions continues il résulte que les sommes 
de Fejér qui lui correspondent convergent vers f au sens de la métrique du même 
espace C[—x, nl. Des théorèmes analogues peuvent être obtenus aussi pour d’au- 
tres espaces fonctionnels, en particulier, pour l’espace Z,[—x, x]. Plus précisé- 
ment, on a le théorème suivant qu'il est naturel d’appeler théorème de Fejér 
pour les fonctions sommables : 

Si f est une fonction sommable sur le segment [—n, x], ses sommes de Fejér 
convergent vers f par rapport à la norme de l'espace L\l—n, x]. 

La démonstration de cette proposition peut être obtenue, moyennant des 
raisonnements pareils à ceux du n°1. Nous ne les reproduirons pas ici. Remar- 
quons toutefois le fait important suivant qui résulte du théorème de Fejér pour 
les fonctions sommables. 

Toute fonction sommable est définie de façon unique (à l’équivalence près) 


par ses coefficients de Fourier. 
En effet, soient f et g deux fonctions sommables ayant les mêmes coeffi- 


cients de Fourier. Alors tous les coefficients de Fourier de la fonction f — g 
sont nuls. Par conséquent, toutes les sommes de Fejér de f — g sont identique- 
ment nulles. Mais alors leur limite dans L;, c.-à-d. la fonction f — g est nulle 


presque partout. 


$ 3. Intégrale de Fourier 


1. Théorème fondamental. Au $ 1 nous avons établi les condi- 
tions pour qu’une fonction périodique soit représentable par une 
série de Fourier convergente, c.-à-d. par une superposition d'oscil- 
lations harmoniques. Essayons maintenant d'étendre ce résullat 
aux fonctions non périodiques. Nous verrons que sous 
des hypothèses supplémentaires assez générales une telle représen- 
tation est possible, seulement dans ce cas non par une série, mais 
par une intégrale, dite intégrale de Fourier. 
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Commençons par quelques considérations suggestives. Soit f une 
fonction vérifiant sur tout intervalle fini les conditions suffisantes 
pour qu'elle soit développable en série de Fourier. Autrement dit, 
on suppose que la fonction f est sommable sur tout intervalle fini 
et qu'elle vérifie en tout point la condition de Dini. En considérant 
la fonction f, par exemple, sur le segment [— /, !], on peut écrire 
son développement en série de Fourier: 


f(x) — ms (ax cos +03 sin z). (1) 


h—1 


Remplaçons ici a, et b, par leurs expressions: 


l l 
| 4 k 
ao = + FL a = + | cos rar, 
_—| _ 


l 
L | @)sin ra. 
—] 


Il vient 
l l 


f(a)=+ E () dt + S ( À F(E) cos TE x cos TE + dt + 
” 


RkR=1 —l 


l 
+2 | F6) sin x sin Pt dt) = |; | (&) dt + 
—i 


00 l 
| kTt kTt 
++ » \f f(® [cos + x cos Et + sin x sin + | dé, 


e" 
Î 
> 
| 
—— 


fa = E Od+r ZT À SG) cos PE (— x) à. (2) 


Ajoutons aux hypothèses concernant la fonction f encore une: sup- 
posons cette fonction absolument intégrable sur toute la droite, 
c.-à-d. 


| L/@ Id < oo. (3) 


Passons maintenant (pour le moment, de façon purement formelle) 
dans l'égalité (2) à la limite pour / — oo. En vertu de la relation 
(3), le premier terme du second membre de (2) tend vers zéro quand 
| — oo. Le deuxième terme peut être considéré comme la somme 
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D! 


intégrale (étendue à un intervalle infini) de la fonction 


F (à) = Î cos à (2) a 
— l 
pour l'intégrale 


F (à) dà, 


St, 8 


si l’on pose À, — F et AA — _ . Par conséquent, le passage formel 
à la limite dans (2) pour / —+ © conduit à l'égalité suivante: 
f(x) =+ | dà | f(t) cos À (t— x) di. (4) 
0 — 00 


C'est précisément la représentation cherchée. Avec les notations 


di = _ À f (&) cos Àt dt, 


bi, = | jf (t) sin M dt 


l'égalité (4) peut être écrite sous la forme suivante qui ressemble 
à la série de Fourier: 


1 (x) = | (a; cos Àzx + b, sin Àx) dA. (9) 
Ô 


Nous avons obtenu l'égalité (4), appelée formule de Fourier, 
à l’aide du passage formel à la limite. On pourrait justifier ce pas- 
sage (sous les hypothèses faites plus haut relativement à la fonction 
f). maïs il est plus simple de donner une démonstration directe de 
l'égalité (4). Ainsi donc, démontrons le théorème suivant. 


Théorème 1. Si la fonction f est absolument intégrable sur 
toute la droite numérique et vérifie au point x la condition de Dini, 
on a 


[s,e) 


f(x) = | æ j f(t)cos A (i— x) dt. 


Démonstration Posons 
A 00 


J(4)=—+ | dr | f(cosà (t— x) dt. (6) 


0 — 00 
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Il s’agit de démontrer que limJ (4) existe et qu'elle est égale 


À — 00 
à f(x). Puisque la fonction jf est absolument intégrable, l'intégrale 
intérieure dans (6) est convergente et l'intégrale double est absolu- 
ment convergente. En appliquant le théorème de Fubini, on inter- 
vertit les intégrations dans (6): 
(ee) A O0 
1 4 sin À (t— 
J(4)=+ | dt À f(E)cos A (t— x) dh= | FCI à. 


— co 0 O0 


A l'aide du changemeni de variabies £ — x — z réduisons cette 
intégrale à la forme 


J (4)=+ Î f (+2) SNA G. (7) 


Z 


L'égalité bien connue 


+ | ME g=1 (45>0 
permet d'écrire la différence J(4) — f(x) sous la forme 
J(4)—j (a) = + [ 1GLD TE sin Az de. (8) 
Décomposons l'intégrale du second membre en une somme de 
trois termes de la manière suivante: 


N 
J (4)—f (0) = À | MEHOIO sin 42 di + 
=N 
1 © Of(x+z) . __ f(x) sin Az 
+ | sin Azdz = = az. 
IZT>N tzIZN 


Les deux derniers termes de cette somme sont des intégraies unifor- 
mément convergentes pour À > 1 et chacune d'elles peut être rendue 


. re s €£& . . . 
inférieure à z Si le nombre W est choisi suffisamment grand. En 


ce qui concerne le premier terme, (pour À fixé) il tend vers zéro, 
quand À —+ œ (en vertu du lemme 1, $ 1 et de la condition de Dini). 
Par conséquent, on a 


Jim (7 (4)—7(x))=0, 


ce qu'il fallait démontrer. 
2. L'intégrale de Fourier sous forme complexe. Dans la formule 
intégrale de Fourier (4) l'intégrale intérieure est une fonction paire 


27—0167 
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de À, ce qui permet d'écrire cette formule sous la forme 


(a) = | d} | FG) cos à (t— x) dt. (9) 


— CO — O0 


D'autre part, de l’intégrabilité abosolue de la fonction f il suit que 
l'intégrale | f (&) sin À (4 — x) dt existe et apparaît comme une 


— 00 
onction impaire de À. Pour cette raison 


_ | dà | f(é)sin A (t— x) dt —0 (10) 


(si l'intégrale par rapport à À est conçue au sens de la valeur principa- 


N 
le, c.-à-d. comme lim |). En ajoutant à (9) l'égalité (40), 
Novo »= 
multipliée par — i, on obtient 
l 00 ee) | | 
(a) =— | dà | fes dé. 


Cette égalité sera appelée formule complexe de Fourier. 


$ 4. Transformation de Fourier, propriétés 
et applications 


1. Transformation de Fourier et formule d’inversion. La formule 
intégrale de Fourier peut être représentée sous forme de deux égali- 
tés. Posons 


(= | fOe-ût ar. (1) 
Alors _ 
fa=g | tea (2) 


Remarquons que la formule (1) a un sens pour toute fonction 
absolument intégrable f. Elle définit une application, appelée 
transformation de Fourier, qui à chaque fonction f € L4 (— co, co) 
fait correspondre une fonction bien déterminée g, définie sur toute 
la droite numérique. La fonction g s'appelle La transformée de Fourier 


de la fonction initiale f. 
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La formule (2) qui exprime la fonction f par sa transiormée de 
Fourier s'appelle formule d’inversion de la transformation de Fourier. 
On remarquera la ressemblance entre les formules (1) et (2). La 
deuxième ne diffère de la première que par le signe de l’exposant 


et par la présence du facteur J- devant l'intégrale. On pourrait 
obtenir ici une plus grande symétrie, en définissant g par la formule 


O0 


1 —1ÀX / 
0 =TE | f(x) ei az. (1°) 
Alors la formule d’inversion aurait la forme 
jo À etyeisar 2’) 
V/2r _e 


et les deux formules ne différeraient que par le signe de l’exposant 
de e. 

Pourtant, malgré la ressemblance apparente des formules (1) et (2), 
elles sont, en fait, différentes: dans la première l'intégrale existe 
au sens habituel (car f € L, (— oc, c)), tandis que dans la seconde 
l'intégrale n'existe qu’au sens de la valeur principale. En outre, 
l'égalité (1) représente la définition de la fonction g, tandis 
que l'égalité (2), qui n’est qu’une autre écriture de la formule 
intégrale de Fourier, renferme l'affirmation que l'intégrale 
figurant dans son second membre est égale à la fonction initiale. 
Comme nous l’avons vu plus haut, pour assurer cette égalité, il 
faut imposer à f, outre l’intégrabilité, encore d’autres conditions, 
par exemple, la condition de Dini. 

Remarque. Nous avons défini la transformée de Fourier 
g pour toute fonction f de L4 (— oc, co) et montré que la fonction 
f, vérifiant la condition de Dini en tout point, s'exprime à l’aide 
de la formule d’inversion par sa transformée de Fourier g. Cet état 
de choses est exactement le même que celui qui se présente dans le 
cas des séries de Fourier. En effet, les coefficients de 
Fourier 


Ta 
1 inx 
Cn= 5 | f(x)e"" dx 
LL 


sont définis pour toute fonction f € L, [— x, nl, mais la conver- 
sence de la série de Fourier 


O0 
D Cnei"* 


N—= — 00 


21% 
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(qui joue ici le rôle de la formule d’inversion) ne peut être assurée 
que pour certaines conditions supplémentaires (condition de Dini). 
D'autre part, pour la transformée de Fourier (de même que pour 
la série: cf. fin $ 2) on a la proposition suivante: si la fonction 
f E L1(— ©, oc) est telle que 


| f{x)e-‘x dr = 0, 


alors f (x) — Ô presque partout. 
En effet, de l'égalité ci-dessus il résulte tout d’abord que quels 
que soient les réels £ et À, on a 


| f(x+t)e-x dr = 0. 


Posons maintenant 
Ë 
pa@= | f(&+5 à, 


0 


où Ë est un réel fixé arbitraire. En appliquant le théorème de Fubini 
et en utilisant la condition imposée à la fonction f, il est aisé de 
voir que la fonction @ (qui, comme f, appartient à L, (— oo, c)) 
satisfait à la même condition, c.-à-d. que 


| (x) ex dr —0 


pour tout réel À. Or, comme on le voit facilement, la fonction o est 
absolument continue sur tout segment fini et, donc, admet presque 
partout une dérivée finie. En particulier, cette fonction vérifie 
presque partout la condition de Dini. Par conséquent, en vertu du 
théorème 1, $ 3, elle est nulle presque partout, parce que sa transfor- 
mée de Fourier est identiquement nulle. Comme la fonction œ est 
continue, on a donc œ (x) = 0. Ceci implique, en particulier, que 
pour tout réel £ on a 


et, donc, f (x) — O presque partout. 
Considérons maintenant quelques exemples. 
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4. Soit f(x) — e-Yl*l, > 0. Cherchons la transformée de 
Fourier de cetle fonction. On a 
g (À) = | e-vlxle-ikx dr — | e-vlxl (cos Ar — i sin At) dx — 


— 2 | e-W“cos Ar dx. 


Sd 8 


En intégrant deux fois par parties, on obtient. 


2y 
g (à) = A+ Y ° 


2. Soit 
4 pour |x|<a, 
j (= | 
O pour |x|>.a. 
Alors 
o q ina —iAa 2 si À 
— iAx — —ihx 6 TE in Ag 
g (à) — | f{x)e-à dz= | e x dx — nt = — 
_ 00 a 


(Il importe de remarquer que la fonction gici n'appartient 
pas à L, (— co, o).) 


3. Soit f(x) =. Alors 


00 à 
g À) — | CS . (3) 


Le plus simple est de calculer cette intégrale par la méthode des 
résidus. Soit d'abord À => 0. Juxtaposons à l’axe réel, sur lequel 
on prend l’intégrale (3), une demi-circonférence de rayon infiniment 
grand, située dans le demi-plan inférieur (c.-à-d. dans celui où l’ex- 
ponentielle e—Ÿ}* tend vers zéro). Alors l'intégrale (3) est égale 
à la somme des résidus de la fonction à intégrer, situés dans le demi- 


plan inférieur, multipliée par (—2xni). Dans le demi-plan inférieur 
—1Àx 
la fonction RC n’a qu’un pôle simple au point x — — ai. Le 


résidu en ee point se trouve selon la règle connue suivante: si 


f (z) — ee , (a) Æ 0 et 1 (z) a au point z — a un Zéro simple, 


le résidu de la fonction f au point a est égale à Le . Dans notre cas 


on à 
—aÀ 
gd = — ni. = —— pour À >0. 
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Pour À < 0, en procédant de la même manière (le demi-plan 
inférieur étant remplacé par celui supérieur), on obtient 


g a : nec} 


a 
Donc, finalement on a 


ner alAl 
gO)= TE (— 00 LA< 00). 
D'ailleurs, ce résultat peut être obtenu immédiatement par la for- 
mule d’inversion, en utilisant l'exemple 1 et le théorème 1, $ 3. 
4. Soit f(x) —e-%*. Alors 


O0 


g (À) = | e-ae-ix dr. (4) 


— 00 


La fonction à intégrer ici est analytique, n’a pas de singularité 
dans la partie finie du plan et tend vers zéro le long de toute droite 
parallèle à l’axe réel. Donc, en vertu du théorème de Cauchy, l’inté- 
grale (4) ne change pas de valeur, si au lieu de la prendre sur l’axe 
réel, on la prend sur une droite quelconque z — x + iy (y — const), 
parallèle à cet axe. Aïnsi, 


O0 O0 
£ (À) — | e-ax+iv)2,e-iMx+iy) dr — ea? +1, | e-ax2-2aixy— ilx ]yr — 
O0 O0 


O0 
— eay?+Ày | e—ax?-ix(2ay+à) dx. 
O0 


Choisissons une valeur constante de y de façon à faire disparaître la 
partie imaginaire de l’exposant de l’exponentielle à intégrer, c.-à-d. 


pOSOns y — — u. Alors 


\2 A2 © a2 — 
A — — —— jf _ — T 
g(M=e f#  2a | erdx—e a y = 


car 


En particulier, si l’on prend a — 5: On obtient 


— - 
g=V2re ?, 


x2 
2 
9 


f(x) =e 
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22 
c.-à-d. la fonction e ? coïncide avec sa transformation de Fourier 
{à un facteur constant près). 

2. Propriétés fondamentales de la transformation de Fourier. 
De la formule (1) qui définit la transformation de Fourier découle 
une série de propriétés de cette transformation que nous nous propo- 
sons d'étudier ici. Pour simplifier l'écriture nous désignerons la 
transformée de Fourier d’une fonction f par le symbole F [f]. Autre- 
ment dit, nous désignerons par F l'opérateur linéaire défini sur 
l’espace L, (— co, oo) et faisant correspondre à toute fonction de 
cet espace sa transformée de Fourier À). 

1. Si une suite {f,} de fonctions de L, (— ©, co) est convergente 
pour la métrique de l’espace L, (— oo, oo), la suite de leurs transfor- 
mées de Fourier g, = F [f,l est uniformément convergente sur toute 
da droite. 

Ceci résulte immédiatement de l'évaluation évidente: 


O0 


| En (D) — 8m GIE À ln (r)— fn (a) |d2. 


— œ 


2. La transformée de Fourier g d’une fonction absolument inté- 
grable f est une fonction continue bornée tendant vers zéro quand | À |—- oo. 
En effet, grâce à l'évaluation 


OO 


EUX | 14e 


— 0 


on voit aussitôt que la fonction g = F [fl est bornée. Si f est la fonc- 
tion caractéristique de l'intervalle (a, b), sa transformée de Fourier 

| e ha _ ,—ihb 

g (À) — | ex ÊT = ———— 

(42 
Cette fonction est évidemment continue et tend vers zéro quand 
1 À | — oc. Comme l'opération F de passage de f à g est linéaire, 
on en déduit que la transformée de Fourier de toute fonction en 
escalier (c.-à-d. de toute combinaison linéaire de fonctions caracté- 
ristiques d’intervalles) est aussi une fonction continue tendant vers 
zéro pour À — + oc. Or, l’ensemble des fonctions en escalier est 
partout dense dans L, (—c, æ); donc, si f € L;, il existe une suite 
{A} de fonctions en escalier convergeant vers f dans L, (—oco, co). 
Mais alors, en vertu de la propriété 1, la suite des fonctions g, — 
— F{[f,] converge uniformément sur toute la droite numérique vers 
la fonction g — F [fl]. Par conséquent, la fonction limite g est aussi 
continue et tend vers zéro quand | À | — oo. 


1) N’appartenant pas, en général, à Z4. 
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Exercices. 1. Démontrer que la transformée de Fourier g d’une fonc- 
tion absolument intégrable f est uniformément continue sur toute la droite 
numérique. 

2. Soit B l'espace des fonctions uniformément continues sur (—c, ) et 
tendant vers zéro à l'infini. Montrer que la transformation de Fourier F est un 
opérateur de Li (— ©, ©) dans B ayant pour norme 1 et vérifiant la condition 
Ker F = 0. 


3. Si f est une fonction absolument continue sur tout intervalle 
fini et f € L, (—o, ), alors 


FIfI = iàF [f]. 


Donc, à la dérivation d’une fonction (sous les hypothèses indiquées 
ci-dessus) correspond la multiplication de sa transformée de Fourier 
par iÀ. 

En effet, une fonction absolument continue sur tout intervalle 
fini peut s’écrire sous la forme 


f (a) o+(r (0 dt. 
0 


Du fait que la fonction f est absolument intégrable il résulte que le 
second membre de cette égalité a une limite quand x —+ oœ et quand 
x — —oo. Cette limite ne peut être que O0, car autrement la fonction f 
ne serait pas intégrable sur toute la droite numérique. En tenant. 
compte de ce fait et en intégrant par parties, on obtient 


F1Q)= | f(pe-tr dr 


(net Li | f(x)e-ÿ dr = inF [fl (à) 


ce qu'il fallait démontrer. 

Si la fonction f est telle que f*-? est absolument continue sur 
tout intervalle et f, . .., ft* € Li (—o, oo), par des raisonnements 
analogues on obtient 


EF [f®] = Gr (fl. (5) 


4. Liaison entre l’ordre de dérivabilité d’une fonction et la rapidité 
de décroissance à l’infini de sa transformée de Fourier. En divisant les 


deux membres de (5) par (iÀ)* et en tenant compte du fait que la 
transformée de Fourier tend toujours vers zéro à l’infini (propriété 2), 


on conclut que si f® est absolument intégrable, alors 


_IFIf#]] 
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c.-à-d. dans ces conditions F [f] décroît à l'infini plus vite que 
LS Donc, plus l’ordre de dérivabilité de f sur Z,; est grand, plus 
la décroissance de sa transformée de Fourier à l’infini est rapide. 

5. Si f" existe et appartient à L, (—o, ), alors F [f] est abso- 
lument intégrable. 
En cffet, dans ces conditions F [f] est bornée et décroît à l’infini 


plus vite que 5 . D'où l’intégrabilité. 

Plus haut (propriété 4) nous avons montré que plus la fonction f 
admet de dérivées, plus la décroissance de sa transformée de Fourier 
à l’infini est rapide. La proposition duale est également vraie, c.-à-d. 
plus la décroissance de f est rapide, plus sa transformée de Fourier 
est lisse. Plus précisément, on a la proposition suivante : 

6. Supposons la fonction f (x) ainsi que xf (x) absolument intégra- 
bles. Alors la fonction g — F {fl est dérivable et 


g Q)= FÎ—ixf (x)]. (6) 


En effet, si l’on prend la dérivée de l'intégrale 
| f(x)e-"x dx 


qui définit g par rapport au paramètre à, on obtient l’intégrale 


— i | xf (x) ex dx 


— CO 


qui (en vertu de l’intégrabilité de la fonction xf (x)) converge uni- 
formément par rapport à À. Donc, la dérivée de la fonction g existe 
et on a (6). 

Si f est telle que les fonctions f (x), xf (x), . . ., x?f (x) sont abso- 
lument intégrables, des raisonnements analogues montrent que la 
fonction g admet des dérivées successives jusqu’à l’ordre p inclusi- 
vement et 


9 A) = Fl(—ix)f (1 (k=0,1,..., p). 


7. Si l’on exige que la fonction f décroisse à l’infini encore plus 
vite, la fonction g devient encore plus lisse. De l’hypothèse que 
xPf (x) € Li (— co, œ) pour tous les p il résulte que la fonction g 
est indéfiniment dérivable. Supposons maintenant que el*lf (x) € 
€ L4 (— ©, co) pour un certain 6 > 0. Alors la fonction g (À) peut 
être prolongée analytiquement de l’axe réel À à une bande du plan 
complexe Ë = À + iu qui est d'autant plus large que la valeur de Ô 
est plus grande. De toute façon, on peut affirmer que g est une 
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fonction analytique, si | u | << Ô. En effet, l'intégrale 


[ f(x) ext dx 


est évidemment convergente pour | u |  Ô et définit une fonction 
continue qui coïncide sur l’axe réel avec la transformée de Fourier 
de la fonction f. Le fait que pour | u | 6 cette fonction est déri- 
vable au sens de la théorie des fonctions analytiques se démontre 
exactement comme la propriété 6. 

3. Complétude des systèmes des fonctions d’Hermite et de Laguerre. 
En utilisant les considérations de l’alinéa précédent, on peut montrer 
que si une fonction mesurable f est différente de zéro presque partout sur 
un intervalle (a, b), où —o < a < b < co, et vérifie presque partout 
sur cet intervalle la condition | f (x) | < Ceôlxl, où ô => 0, alors le 
Système des fonctions {x"f (x)}, n — 0,1,2,... est complet dans 
l’espace L; (a, b). Il s'ensuivra, en particulier, que les fonctions 
d'Hermite et de Laguerre forment des systèmes complets respec- 
tivement dans Lo (—o, oo) et Lo (0, oo) (cf. n°%7 et 8, $ 3, 
chap. VII). 

Démontrons la proposition sur la complétude, énoncée plus haut. 
Supposons que le système {x"f (x)} ne soit pas complet. Alors, en 
vertu du théorème 4, n° 5, $ 4, chap. III, il existe une fonction non 
nulle k € L; (—o, oo) telle que 

| x'f(xz)h(z)dz—0 (n—0, 1,2, ...). 
(Dans le cas où l’espace considéré Z> (a, b) est complexe, au lieu de 
h (x) on doit écrire À (x)). Il est clair que fh € L; (a, b) et, qui plus 
est, e611x1 fh € L, (a, b) pour tout ô, 6. Dans la suite il sera com- 
mode de supposer les fonctions f (x) et k (x) définies sur toute la 
droite numérique, en les prolongeant, au besoin, par zéro au-delà 
de (a, b). Soit g la transformée de Fourier de la fonction fh, c.-à-d. 


eQ)= | f()h (et da. 


D'après ce qui précède, la fonction g peut être prolongée analytique- 
ment à la bande | Im € | 6. D’autre part, en vertu de la propriété 6, 
toutes les dérivées de cette fonction s’annulent pour À — 0, de sorte 
que g (À) = 0. D’après la propriété d’unicité, démontrée au n° 1, 
on en déduit que f (x) k (x) — 0 presque partout et, par conséquent, 
h (x) — O presque partout, car f (x) est presque partout différente 
de zéro. Or, ceci contredit l’hypothèse que k est une fonction non nul- 
le. La contradiction obtenue prouve que le système {2"f (x)} est 
complet. 
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4? 


4. Transformation de Fourier des fonctions indéfiniment dérivables 
décroissance rapide. Puisque après le passage d’une fonction f 
sa transformée de Fourier g les propriétés de dérivabilité et de 
décroissance à l'infini de la fonction changent de rôles, il est facile 
d'indiquer des classes naturelles de fonctions que la transformation 
de Fourier applique dans elles-mêmes. 

Soit Sx l’ensemble des fonctions indéfiniment dérivables sur 
la droite numérique dont chacune admet un système de constantes 
Cha (dépendant de la fonction f et des nombres p, q) telles que 

[PP (x) | << Cpg- (7) 
Montrons que si f € S+, on a de même g = F[flE SX. De l’inéga- 
lité (7) il résulte tout d’abord que chacune des fonctions 2°f® (x) 


est absolument intégrable. En effet, comme l'inégalité (7) est véri- 
fiée pour tous les pet q,ona 


C'p40 
p+i:q 
ÉD 


ds go 


« e L A 0 e e 4 
c.-à-d. la fonction x°-?f( (x) décroît au moins aussi vite que 3 


Ceci implique, à son tour, que la fonction F [fl admet des dérivées 
de tous les ordres. Enfin, d’après le n° 2, de la sommabilité de 
FO (x), g —1,2,..., il résulte que g — F[f] décroît à l'infini 


plus vite que ETE Considérons maintenant les fonctions 
GA) Q) = (—i)fF L(a7f G))® 1; 

chacune d'elles est majorée par une constante D,,, comme transfor- 

mée de Fourier d’une fonction intégrable. Donc, si f ES, on a 

également g — F[ÎfIE S,x. Réciproquement, soit gE Sx; alors, 

d’après ce qu’on vient de démontrer, la fonction 


CO 


f(= | g(e-ñs ax 


appartient à S+. Posons f (x) — SL f* (—x). Il est clair que f € So. 


D'autre part, selon la formule d'’inversion, on a 


sg | r(pewdr= | f(ve-tx da, 
C.-à-d. g est la transformée de Fourier de la fonction f € S.. Ainsi, 
la transformation de Fourier applique la classe S, sur elle-même. 
Il est clair que cette application est biunivoque. 


O0 


Exercice. Soit fESx et | xPf (x) dx = O pour tous les p > 0. 


Résulte-t-il de là que f (x) = 0? 
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9. Transformation de Fourier et convolution. Soient f; et f, 
deux fonctions intégrables sur toute la droite numérique. La fonction 
fG)= | HE (9 dE 
s'appelle convolution de f, et f:. La fonction jf (x) est définie pour 
presque tous les x et intégrable. En effet, l’intégrale double 


[ [nr te—8) dde 


existe, parce que l'intégrale 
| [IAE (man 


existe (cf. remarque concernant le théorème de Fubini, page 312). 
Par conséquent, l'intégrale 


[red [a | 1ORt-24& 


existe aussi. La fonction f est notée f, + f.. Cherchons la transformée 
de Fourier de la convolution de deux fonctions de Z,. En appliquant 
le théorème de Fubini et en posant x — £ — 1, on obtient 


il j (x) er de = Ï (i fi (E) fe (x —E) dE À ex da — 
- | fi.) {j f(x —E) es da } dé = 
- | fi CE) { Î fa (n) ee dn } dE = 
c.-à-d. 


F [fa + fo] = F [1.F [fo]. 


Ainsi, La transformation de Fourier réduit l'opération de convolution 
à une opération plus simple: la multiplication des fonctions. Ce résul- 
tat joue un rôle important dans de nombreuses applications de la 
transformation de Fourier. 
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6. Appication de la transformation de Fourier à l’équation de 
la chaleur. L'application de la transformation de Fourier aux équa- 
tions différentielles est basée sur le fait (cf. n° 3) qu’elle réduit 
l'opération de dérivation à celle de multiplication par la variable 
indépendante. Ainsi, une équation différentielle linéaire à coeffi- 
cients constants 


y Lay +... Laniy + Any = (x) (8) 


se réduit au moyen de la transformation de Fourier à une équation 
algébrique de la forme 


GA) 2H a (A) 15 +... Han iiÀz + anz = V (à), (9) 


où z = F[ylet p — F [œl. Cependant, lorsqu'il s’agit des équations 
différentielles ordinaires, ce procédé n'’ouvre aucune perspective 
essentiellement nouvelle, car la résolution des équations linéaires 
à coefficients constants est en elle-même un problème qui ne pré- 
sente pas de grande difficulté. En outre, le passage de (8) à (9) n’est 
possible que si la fonction inconnue y — y (x) est intégrable sur 
toute la droite numérique, ce qui n’a pas toujours lieu pour les 
équations linéaires à coefficients constants. 

L'importance de la transformation de Fourier est essentielle, 
lorsqu'elle est appliquée aux équations différentielles aux dérivées 
partielles ; dans ce cas elle permet, sous certaines réserves, de réduire 
la résolution d’une telle équation à la résolution d’une équation 
différentielle ordinaire. Montrons ceci sur l'exemple du problème 
de Cauchy pour l’équation de la chaleur. 

On va chercher la solution de l’équation 


du(x, t d2u(x, t 
TR D 
définie pour —o «7 x <T ©, { > 0 et coïncidant pour £{ — 0 avec 
une fonction donnée wo (x). Le sens physique de ce problème est de 
trouver la température d’une barre calorifère illimitée à chaque 
instant £{ >> O, sachant qu’à l'instant initial £ — 0 sa température 
en chaque point est uo (x). 

En supposant que les fonctions uo (x), u, (x) et u, (x) appartien- 
nent à L4 (—©, æ), nous allons chercher la solution du problème 
posé parmi les fonctions uw (x, t) vérifiant les conditions suivantes: 

1) les fonctions u (x, t), u, (x, t), u,. (x, t) sont absolument 
intégrables sur tout l’axe x pour tout t > 0 fixé; 

2) la fonction u; (x, {) admet sur chaque intervalle fini 0 << 
< T une majorante intégrable f (x) (indépendante de ft): 


O0 


us (s, DIRf() | f(a)dz < 00. 


— © 
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Appliquons à l'équation (10) la transformation de Fourier par 
rapport à x. Alors au second membre nous aurons 


Flusxk(x, t)]= —v(A,t), où v(A, ft) —Flu(x,t)]; 


quant au premier membre de cette équation, en vertu de la condi- 
tion 2), il deviendra 


CO O0 


F [u] — | us (x, t) eh de = | u(x,t)e-ixdx—v,(X, t). 


— 00 — 0 


Aïnsi, la transformation de Fourier ramène l'équation (10) 
à l'équation différentielle ordinaire 


Vi (A, t)= — dv (à, ti) 
dont il faut maintenant trouver la solution qui pour { — 0 coïncide 


avec la fonction 


Vo (À) = F[uo(x)] — | uo(x)e dx. 


La solution cherchée sera, évidemment, 
v(A, t)—=e tu (À). 


Maintenant, pour obtenir la solution de notre problème initial, il 
suffit de trouver la fonction w (x, t) dont la transformée de Fourier 


est v (à, té). 
En utilisant l’exemple 4, n° 1, on obtient 
2 Î _— 
At — EE |. 
e F | Va e | 
Donc, 
{ _ 2? { _ x? _ 
_ at |, — &t 
U (À, DES | F [w(x)] Flore +uo (a) |, 
c.-à-d. 
S- 
_—_ 7 4t _ 
UD | e LE uo(x—E) dé. 


L'intégrale obtenue s’appelle intégrale de Poisson pour l'équation 
de la chaleur. 

7. Transformation de Fourier des fonctions de plusieurs variables. 
La notion de transformation de Fourier, considérée plus haut pour 
les fonctions d’une variable, s’étend facilement aux fonctions de 
plusieurs variables. 
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Soit f (ti, Ze, . « ., æ,) une fonction intégrable sur tout l’espace 
n-dimensionnel R7. Sa transformée de Fourier est par définition 


g (4, ho, …. Àn) = 


C 
— © 


— | ue À fau ane. tn)e-ihtashet...4endn) dr, dan. 


Cette intégrale n-uple existe manifestement, car la fonction 
Î (ti, To, . . ., &,) est intégrable: en vertu du théorème de Fubini 
elle peut s’écrire sous la forme suivante: 


g (Ad ce, An) = 


— | {. [4 fan Los ce. ra) eh das } x 


X e—ixe ds } e-isnhn dtn. (11) 


Autrement dit, le passage d’une fonction de n variables à sa trans- 
formée de Fourier peut être effectué successivement par rapport 
à chacune des variables (dans n’importe quel ordre). Par inversion 
successive des n opérations du second membre de (11), on obtient 


la formule 


1 (tr Los Tn) = 


— [ { [ {  eGushe 4, An) einän dhn } x 


X eitn-thn-1 din 4... } ex du. 


Cette formule peut s’écrire sous la forme 


i 00 00 
1 (ti, T9, es En) = on | . | £(A, À, .., Àn) X 


x eiea-temhet. . nhn) GA... dhn: (42) 


mais, puisque la fonction g (A4, À, ...,À,) n’est pas nécessaire- 
ment sommable sur l’espace R” tout entier, il faut alors indiquer le 
sens qu’on doit attribuer à l’intégrale n-uple de (12), de même que 
les conditions pour que la fonction f (x, Z2, . . ., &1) Soit représen- 
table par cette intégrale. 

L'une des réponses possibles à ces questions est donnée par le 
théorème suivant. 
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Théorème. Soit f (x, Ze, . . ., &,) une fonction intégrable 
sur tout l’espace RT et vérifiant les conditions 


PACTE NT Las +. Zn) — (x1, Lay ec.) Zn)[&KC | f”, 
[ft Zoe, ..., Zn) —f (ru da, ..., 2n)[KC(x)[8f, 


| f(x, La, -.., LTn Lin) — f(x: Lo, Tn)|< 
<C(x:, T2, +.) Ln-1) | Ën [°, | 
où : (13) 


O<a<i, | C(x)dm<oo, … 


.. [ …. | C(Xi, Lo, ..., Tn-1) dti do... dtn_y < 0. 


x J 
— O0 — C0 


Alors la formule d’inversion (12) est vraie, si par l'irtégrale qu’elle 
contient on entend 


! Ni Nn-1 Nn 
Gays Jin | {... lim | {im | 8 (as Âos es À) X 
Ni—0 UN; Nn-1-00 _Nn Nn-o CNh 
x etrnhn dhn } efrn-tin-t dns. À eirsia du, 
En effet, comme la fonction f (x, xs, . . ., &,) est sommable 
sur R”, en vertu du théorème de Fubini elle est sommable par rap- 
port à x, pour presque tous les x2, . .., x,. Donc, la fonction 


O0 
fa (Aus Los... Tn) = | f (tu Lo, + .., tn)e M dr 
O0 


existe. De (13) il résulte que f (21, x, . . ., æ,), Comme fonction de 
z1, vérifie les conditions du théorème 1, $ 3; pour cette raison, la 
fonction f (x,, Z2, . . ., &,) peut être exprimée par f, à l’aide de la 
formule d’inversion 

N 


1 
. 1 
f (æ1, Lo, Tn) = lim Dr | Ï1 (A4, Lo, ..., Ln) etxiM di. 
Ni 00 
— Ni 


Ensuite, si l’on pose 


00 
Lo (A4, h, T3, Tn) = | fi (4, Toy oc.) Xn) er i*2h2 dx, 
— 00 
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alors de (13) il résulte que pour jf, on a la formule d’inversion 
Ne 


. 1 . 
fG du ce en)= lim 5e | f(u ha... an) else ds, 
N2—00 
— No 
c.-à-d. 
] (x, Lo, .….., LTn) = 


N1 No 
. { . 1 
—= lim 5x | lim = | 2 (4, À, .., Tn) eix2h2 dha } eix1M du. 
Ni 2 


Ni-—00 No 00 2n : 


En définissant de manière analogue 3 (À4, Ào, Àas « « ., Æn), etc., 
nous aboutirons finalement à la formule (12). 

La transformation de Fourier pour les fonctions de plusieurs 
variables est largement utilisée dans la théorie des équations aux 
dérivées partielles. Considérons, par exemple, l’équation 

ôu du Ou 
DE On À Op (14) 


qui décrit le processus de propagation de la chaleur dans le plan. 
On suppose qu’à l'instant initial { — 0 la température est donnée: 


u (O, T, y) = Uo (x, y). 


Si l’on impose à la solution cherchée des conditions analogues à 
celles du n° 6, dans (14) on peut effectuer la transformation de Fou- 
rier par rapport à x et y. Ceci conduit à l’équation différentielle 
ordinaire 

dv 

= — (A2 + 0?) v, (15) 


Ut, À, GO) — | | u (t, x, y)e-x+0ov) dx dy. 


Ayant résolu l'équation (15), on peut trouver ensuite la solution 
de l'équation initiale (14) à l’aide de la formule d’inversion. 


$ 5. Transformation de Fourier dans 
l’espace Z> (— ©, co) 


1. Théorème de Plancherel. Revenons d’abord sur les résultats 
que nous avons obtenus pour les séries de Fourier. Pour plus d’ana- 
logie avec la transformation de Fourier, nous allons considérer la 
série de Fourier sous forme complexe, c.-à-d. nous prendrons sur le 
segment [—x, xl le système orthogonal complet des fonctions 
einx, n —0, +1, +2,... et à chaque fonction f sommable sur 


28—0167 
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[—x, xl nous ferons correspondre la suite de ses coefficients de 
Fourier 
T 


{ in 
Cn= 5 À f(x)e"" dx (n=0, +1, +2, ...). 
— IT 

Si la fonction f est non seulement sommable, mais aussi à carré 

sommable, ses coefficients de Fourier vérifient la condition 
>, [cn < oo. 
N = — 00 

Autrement dit, le passage d’une fonction dont le carré est sommable 
à l’ensemble de ses coefficients de Fourier est une application de 
l’espace euclidien L, sur l’espace euclidien /, ; de plus. cette appli- 
cation est linéaire et vérifie la relation de Parseval : 


20 D [ef = | 1F@) Paz (1) 


N—=— 00 TT 


(c.-à-d. ce passage ne diffère que par un facteur numérique d’une 
application conservant la norme). 

Considérons maintenant la iransformation de Fourier pour les 
fonctions données sur toute la droite numérique et voyons, s’il est 
possible ou non de traiter cette transformation comme un opérateur 
linéaire dans l’espace complexe L: (— oo, co). La difficulté princi- 
pale réside ici dans le fait qu’une fonction à carré sommable sur la 
droite numérique peut ne pas appartenir à L4 (—oo, oo), c.-à-d. 
que pour une telle fonction la transformée de Fourier au sens de la 
définition du $ 4 peut ne pas exister. Néanmoins, pour toute fonction 
f E L, (— oo, ) on peut définir la transformée de Fourier en un 
sens quelque peu différent. On obtient alors le théorème suivant 
qui peut être considéré comme l’analogue de la relation de Parse- 
val (1). 


Théorème (Plancherel, 1910). Pour toute fonction 

f € La (— 00, oo) l'intégrale 

N 

en (= | F(aerix dr 

N 
est, quel que soit N, une fonction de À appartenant à L: (—00, oo). 
Lorsque N — oo, la fonction gA converge pour la métrique de l’espace 
L, vers une fonction limite geton a 


[e,e) OO 
# 


| leG)Pd=2x | 1 (Pr. (2) 


— 00 — 2 
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Cette fonction g s'appelle transformée de Fourier de la fonction f € L:. 
Si f appartient aussi à L, (—, wo), la fonction correspondante g 
coincide avec la transformée de Fourier de f au sens habituel. 


Démonstration. L'idée principale de la démonstration 
consiste à démontrer l’égalité (2) d’abord pour toutes les fonctions 
appartenant à la famille S4 des fonctions indéfiniment dérivables 
à décroissance rapide qui forment un ensemble partout dense dans 
La (—co, æ) et l’étendre ensuite par continuité à Lo (—oo, co) 
tout entier. Réalisons maintenant cette idée en détail. 

1) Soit f1, fo E So. Désignons par g, et g, respectivement leurs 
transformées de Fourier. Alors 


| f1 (x) fe (&) dx — | — | [gi (À) ef dA] fo (x) dx — 


O0 


= [ | 81 () #60 edr]di= | 8:() 80) dà, 


— 00 


où l’interversion des intégrations est justifiée, car la fonction 


g1(A)f2 (x) eihx 


est absolument intégrable sur le plan (x, À). En faisant dans l’égalité 
oblenue f; = f2 — f et g1 — g2 — g, on en déduit que la formule (2) 
est vraie pour toute fonction f € So. 

2) Soit à présent f une fonction quelconque de L: (—co, co), 
nulle en dehors d’un intervalle (—a, a). Elle est alors intégrable 
sur (—a, a) (c.-à-d. appartient à ZL; (—a, a)) et donc, sur toute la 
droite numérique. On en déduit l’existence de sa transformée de 
Fourier 


Q)= | f(ae- az. 


Soit maintenant {/,} une suite de fonctions de S., nulles en dehors 
de (—a, a), convergeant pour la norme de l’espace Lo (—o, ) 
vers f. Puisque f et toutes les f, sont différentes de zéro seulement 
sur un intervalle fini, la suite {f,} converge vers f aussi pour la norme 
de l’espace L, (—c, co). C’est pourquoi (cf. n° 2, $ 4) la suite 
{gn} converge vers g uniformément sur toute la droite numérique. 
En outre, {g,} est une suite de Cauchy dans L,(— 00, co). En effet, 
En — Em E SX; donc, en vertu de ce qu’on a déjà démontré, 


OO [se 


À Len Q)Fdh= 22 | | f5 (2) — fn (2) P dx, 


— 00 — CO 


28* 
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d’où l’on conclut que {g,} est une suite de Cauchy. Ceci implique 
que cette suite est convergente dans Z, et qu’elle a pour limite la 
même fonction g, vers laquelle elle converge uniformément. Par 
conséquent, dans l'égalité 


AE 


on peut passer à la limite pour n — co. Ainsi donc, l'égalité (2) 
est vraie pour toute fonction f € L,, nulle en dehors d’un certain 


intervalle. 
8) Soit, enfin, f une fonction arbitraire de L:. Posons 


f (x) pour [x | N, 
fn (x) = | 
0 pour [zx | > N. 
Il est clair que 


| f — fn ll — 0 pour N — ©. 


La fonction f,, appartient à Li (—o, co), ce qui implique l'existence 
de sa transformée de Fourier habituelle. Celle-ci est égale à 


00 N 
en @)= | fre td | j(ae- x dx. 
— 0 —N 


Comme d’après la partie 2) de nos raisonnements 
{ 
ÎL fn — fu = Îl 8v — 8m |, 


les fonctions g, convergent dans Z, vers une limite que nous dési- 
gnerons par g. Donc, dans l'égalité 


AE EE 


on peut passer à la limite pour V — © et on obtient alors la rela- 
tion (2) pour toute fonction f € Lo (—o, oo). 
La première partie du théorème de Plancherel est démontrée. 
Si maintenant la fonction f appartient aux espaces Lo (—©, co) 
et Li (—oc, ) à la fois, sa transformée de Fourier 


sQ= | fe dx 


existe au sens habituel. Dans ce cas les fonctions f,, convergent vers 
f dans ZA (— 00, ©) et donc, leurs transformées de Fourier g,, con- 
vergent vers g uniformément. Or, d'autre part, nous avons démontré 
que les fonctions g, convergent pour la métrique de L2 (—0o, co) 
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vers une fonction que nous avons désignée par g. On en déduit que g 
coincide avec g. 
La démonstration est achevée. | 
Corollaire. De la relation (2) il résulte immédiatement 
que pour n'importe quelles deux fonctions fi, f2 € L2 (—o, oo) on a 


fhorOdaæ-z | aWama. 


Pour la démonstration il suffit d'écrire l'égalité (2) pour la fonc- 
tion f1 + f2 et comparer les expressions que l’on obtient aux deux 
membres. Si l'égalité (2) signifie que la transformation de Fourier 
conserve la norme dans Z:, la dernière égalité signifie qu’elle conser- 
ve le produit scalaire. 

2. Fonctions d’'Hermite. Le théorème de Plancherel, exposé au 
numéro précédent, montre que la transformation de Fourier peut 
être considérée comme un opérateur linéaire borné F appliquant 
l’espace L: (— ©, co) sur lui-même. Si dans cet espace un système 
orthonormé complet est choisi, l’opérateur F (comme tout opérateur 
linéaire) peut s’écrire à l’aide d’une matrice infinie. La forme de 
cette matrice dépend, bien sûr, du choix de la base. La matrice cor- 
respondant à un opérateur est de la forme la plus simple dans le cas 
où la base choisie est constituée par les fonctions propres de l’opéra- 
teur donné: dans ce cas la matrice est diagonale. La question est 
de savoir, si une telle base existe pour la transformation de Fourier F. 
Autrement dit, il s’agit de savoir, quelles fonctions de L2 (— co, co) 
sont propres pour la transformation de Fourier F ? A cet effet, remar- 
quons qu’en appliquant la transformation de Fourier à l’équation 

2 
D — af = Uf, (3) 


dx? 


Q # e A « ? . d2 
on obtient une équation de la même forme 1) (car à l'opération TS 


correspond la multiplication par —4? et à la multiplication par —2* 
2 

correspond l'opération Fa) . C’est pourquoi il est naturel de chercher 

les fonctions propres de l'opérateur F comme solutions de l’équa- 


tion (3). Cherchons les solutions de cette équation, ayant la forme 
x2 


f—=we ?, 
où w est un polynôme. En portant cette expression dans (3), on 
obtient pour w l'équation 
w" — 2xw = (u + 1) w. 


| 1) On suppose, bien sûr, que la fonction inconnue f satisfait aux conditions 
nécessaires de dérivabilité et de décroissance à l'infini. 
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Si l’on pose 
W = Apt aix +... Ant”, (4) 
on est conduit à l'égalité 
(2a+3.2.asx+...+n(n—1)anx?— 
— 22 (a +2ax+...+nant 1 = (pu +1) (ao +ar+ ...+ant"). 


En comparant les termes des deux membres de cette égalité qui 
contiennent les mêmes puissances de x, on obtient 


— 2nan=(u+1l)an,, —2(n—1)an1=(u +1) an: 
et ainsi de suite ; d’une façon générale, 
k(k—1) an — 2 (k — 2) A2 = (U +- 1) Ap-9. (5) 


Puisque le coefficient dominant «a, est supposé différent de zéro, 
on doit avoir 
u= —(2n+1) et an1—=0, 


c.-à-d. u doit être un entier négatif impair. La relation (5) permet 
de déterminer tous les coefficients du polynôme w à un facteur cons- 
tant près. En outre, les coefficients dont les indices sont de parité 
différente de celle du nombre n, c.-à-d. du degré de w, sont nuls. 
Par contre, tous les coefficients dont les indices ont la même parité 
que n sont différents de zéro. On les trouve à l’aide de la formule de 
récurrence 
_ k(k—1) 
UR2 5 In à 


(si a, est donné). Donc, pour w on obtient la formule suivante : 


aR 


Un (X)= An (ar "2 ge + MT) (m2) (m8 (2 @—S) x 4... ] . 
4 4.8 
Ainsi, nous avons construit le système des fonctions 
x2 


Pa (ZX) = Wn (x) e 2  {n=0,1,2,.. ). 
Il est clair que chacune de ces fonctions appartient à Lo (—0co, co) 
(grâce à la présence du facteur EN De plus, ces fonctions sont 
deux à deux orthogonales. En effet, d’après (3), on a 
Pn (£) — 2*pn (x) = — (2n + 1) pr (x), 
Pme (TE) — 2m (x) = -— (2m + 1) Pm (2). 


En multipliant la première de ces égalités par , et la deuxième 
par hr, faisons leur différence ; on obtient 


PnPm — PnPn = 2 (R — M) PrPm 


OU , , , ; 
[PaPm — PmPa] = 2 (1 — M) PrPm. 
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Si mn, en intégrant cette égalité, on obtient 


e 1 e oo, 
| Pn () Pn (a) dr = | [PnPm — PmPn]' dx = 
À œ 
7 2(n—m) [PnPm — PmPn ] — (0. 


Ainsi, l’orthogonalité est démontrée. 
Chacun des éléments , du système orthogonal obtenu est un 
x2 
polynôme de degré n, multiplié par e 2. Par conséquent, les élé- 
ments de ce système doivent coïncider, à des facteurs constants près, 
avec les fonctions d'Hermite que nous avons construites au $ 3, 
chap. VIT, en orthogonalisant la suite 


dans l’espace Le (—co, co). 
Montrons à présent que {w,} sont les fonctions propres de la 
transformation de Fourier : 


FF} — CnŸne (6) 


Ceci résulte des faits suivants: 
1. L'équation (3) est invariante par rapport à la transformation F. 
2. Pour chaque n l'équation (3) admet, à un facteur constant 
x2 
près, une seule solution de la forme P, (x)e ?, où P, est un poly- 


nôme de degré n. 
x2 


3. La transformation de Fourier, appliquée à z2"e ?, donne 
n _* _.* 
(: = e 2 — Q, (x)je ?, où Q, est un polynôme de degré n (la der- 


nière assertion est facile à vérifier par récurrence). 
De l’égalité (6) il résulte que pour tout X entier on a 


FF@Qn = CP. 


Or, la transformation de Fourier, appliquée quatre fois, transforme 
toute fonction en elle-même, multipliée par 4n°. Donc, 


cn = 4T?, 


c.-à-d. ©, ne peut prendre que les valeurs +} 2x et +i V 2x. 
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Aïnsi, la transformation de Fourier F dans l’espace L; (—, oo) 
est un opérateur linéaire qui, dans la base constituée par les fonctions 
d'Hermite, est représenté par une matrice diagonale dont les éléments 


diagonaux sont de la forme HV 2x et +il/ 2x . 


$ 6. Transformation de Laplace 


1. Définition et propriétés fondamentales de la transformation 
de Laplace. L’applicabilité de la transformation de Fourier aux 
équations différentielles est limitée de façon essentielle par le fait 
que cette transformation n’est définie que pour les fonctions som- 
mables sur toute la droite numérique. En particulier, la itransforma- 
tion de Fourier n’est pas définie pour les fonctions croissantes pour 
Z—+ —o où x —+> ©; or, les fonctions de cette sorte apparaissent 
souvent lors de la résolution des équations différentielles. Cette 
difficulté peut être surmontée par extension de la transformation de 
Fourier aux distributions ; cette voie sera brièvement étudiée au $ 8 
du présent chapitre. Une autre voie possible, qui ne dépasse pas le 
cadre du concept classique de fonction et les méthodes classiques de 
l'analyse, consiste à remplacer la transformation de Fourier par la 
transformation dite de Laplace. 

Soit f une fonction (en général, non intégrable sur toute la droite 
numérique) qui devient intégrable, lorsqu'on la multiplie par 
eŸ*, où y est un nombre réel. Alors l'intégrale 


CO [se 
g (s) — | f (x) ei dx — À f(x) er ixhexu dr 
s'avère convergente pour certaines valeurs complexes s — À + in; 
en particulier, elle est convergente sur la droite u = —7y. Sur cette 


droite elle n’est autre que la transformée de Fourier de la fonction 
f (x) ex. 

Du point de vue des applications, le cas le plus important, où 
nos hypothèses concernant l’intégrabilité de la fonction f (x) eŸ* 
sont réalisées, est celui où f vérifie les conditions : 


f(@I< Ce pour z>0, | 
f(x) =0 pour æ< 0 


1) Si la transformation de Fourier est définie par la formule 


(1) 


O0 


1 . 
F[f]=—— | f(x) e 7 ax 
[f] VE J ) 
(c.-à-d. par la formule (1”) du $ 4 et non par la formule (1)), alors sa puissance 
quatrième est un opérateur identique, de sorte que dans la base constituée par 
les fonctions d'Hermite la matrice de F est diagonale et a pour éléments diago- 
naux + 1 et + i. 
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(yo et C sont des constantes). L'intégrale 
e@= | fear | j(De dx (2) 


— O0 


existe pour tous les s — À + in tels que u << —Yÿs, c.-à-d. sur le 
demi-plan limité par la droite Im s — —,; elle représente la trans- 
formée de Fourier de la fonction f (x) e“*. Celle-ci peut être obtenue 
de g à l’aide de la formule d’inversion (nous supposons que f vérifie 
les conditions pour que cette formule soit applicable) 


O0 


fée À g(s) ex da 


LA 
d’où 
; iu+oo | 
(= | g(s)ei®ds (s—A—+iu). (3) 
Îiu— 00 


Puisque la fonction f (x) eH* décroît pour u << —ÿ, comme une 
fonction exponentielle (en vertu de (1)), sa transformée de Fourier g, 
de même que g (s) ef*, est une fonction analytique sur le demi-plan 
Im s < —Ys. 

Procédons maintenant à un changement de variable dans les 
formules (2) et (3), en posant p = is et en désignant g (s) par ® (p). 
Il vient 


D(n)= | f(e dx (2) 
et L 
, — Hioo d ; — H+ioo 
fo=s | ce Le | O(e”dp (3) 
— pic —U—100 


La fonction ® est définie et analytique sur le demi-plan Re p > 
> Yo; elle s’appelle transformée de Laplace de la fonction f (vérifiant 
la condition (1)). L'application définie par la formule (2”) s’appelle 
transformation de Laplace. 

Par ses propriétés, la transformation de Laplace diffère peu de 
celle de Fourier. Cependant, la classe des fonctions pour lesquelles 
la transformation de Laplace est définie, diffère beaucoup de la classe 
L, (— co, c) des fonctions, pour lesquelles existe la transformation 
de Fourier. 

2. Application de la transformation de Laplace à la résolution 
des équations différentielles (méthode opératorielle). La transforma- 
tion de Laplace peut être appliquée à la résolution des équations 
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différentielles. Soit une équation différentielle linéaire à coefficients 
constants 


y Haye DE... + any = (x) (4) 
dant on cherche la solution satisfaisant aux conditions initiales 
y (0) — yo: y (0) = ya, ..., y D (0) = yn-s. (5) 


Appliquons à l’équation (4) la transformation de Laplace !), c.-à-d. 
multiplions cette équation par e ?* et intégrons-la de O0 à oo. Soit 


Y (p)= | y(x)e dx 
0 


la transformée de Laplace de y. En intégrant par parties, on obtient 
la transformée de Laplace de sa dérivée y’: 


Lure dre y(ne | + p À y(o)e dr pY (pv. 
0 0 re 


En appliquant cette formule successivement, on obtient 


00 


Î YO (x) e dx = p (PI Y (D) — Yn-2 — PYn-3 — + + + — D" Yo) — Yn1= 
0 
n--1 
= p'Y (D) —Yn-i— Pyno— poly p'Y (p}— D pr y. 
k—0 


Soit, enfin, 


B (p) — | b(x)e ?" dx. 
0 


En définitive, l'équation différentielle (4) (compte tenu des condi- 
tions initiales (o)) se trouve remplacée, grâce à la transformation de 
Laplace, par l'équation algébrique 


Q ) + Rp) Y ) = B (p), 


où B est la transformée de Laplace de b, Q est un polynôme de degré 
n — À en p qui dépend des coefficients de l'équation (4) et des 
conditions initiales. Enfin, 


n 
R= D anrp}, &—=1 
R=—0 
est le polynôme caractéristique de l'équation (4). 


1) Il est aisé de montrer que son application à l'équation (4) est permise, si 
|b (x) | ne croît pas trop vite. 
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B } 
Y (p) (p) Ç (p) . 


R (p) 
La solution y s'obtient de là par la formule d’inversion 
— Hioo 
1 B (p)—Q( x 
— p—1i00 


On calcule habituellement cette intégrale à l’aide des résidus. 

Une méthode connue de résolution des équations différentielles 
linéaires à coefficients constants est la méthode opérato- 
rielle. Elle consiste en ce que le premier membre d’une telle 
équation 

YO + ay D +... + any =D (x) 


est considéré comme l’image de la fonction inconnue y par l’opé- 
rateur 
n n— 

A(+) = a ram, (6) 
la solution de l'équation étant alors considérée comme l’image du 
second membre de cette équation par l'opérateur inverse de (6). 
L'image par un tel opérateur des fonctions simples, telles que les 
fonctions trigonométriques, la fonction exponentielle, la fonction 
puissance et leurs combinaisons, peut être facilement trouvée 
par des calculs directs. Ceci permet d'obtenir la solution d’une 
équation linéaire à coefficients constants de façon automatique, 
si son second membre est une combinaison de telles fonctions. 
Il est clair que la méthode opératorielle représente en fait l’applica- 
tion, sous forme implicite, de la transformation de Laplace (qui 
établit une certaine correspondance entre l'algèbre des opérateurs 
différentiels de la forme (6) et l’algèbre des polynômes). Ceci peut 
servir de justification de cette méthode qui dans la littérature tech- 
nique apparaît souvent comme une « recette ». 


$ 7. Transformation de Fourier-Stieltjes 


1. Définition de la transformation de Fourier-Stieltjes. Revenons 
sur la transformation de Fourier dans l’espace L4 (—co, œ): 


O0 


= À e-xf (x) dx. 


— 00 


Cette formule peut s’écrire sous la forme de l'intégrale de Riemann- 
Stieltjes 


g(À) — | ein dF (x), (1) 


444 SÉRIES TRIGONOMÉTRIQUES. TRANSFORMATION DE FOURIER ÎCh. VIIL 


4 


ou 


F(= | O4 (2) 


est une fonction absolument continue à variation bornée (égale à 


O0 


| | f (x) | dx) sur toute la droite numérique. Mais l'intégrale (1) a un 
sens non seulement pour les fonctions de la forme (2), mais aussi 
pour n’importe quelles fonctions à variation bornée sur toute la 
droite numérique. L'intégrale 


= [e-xar (ao, 


où Fest une fonction arbitraire à variation bornée sur la droite numé- 
rique, s'appelle transformée de Fourier-Stieltjes de la fonction F; 
l'application qu’elle définit s'appelle transformation de fFourier- 
Stieltjes. Elle jouit de certaines propriétés que nous avons déjà 
établies pour la transformation de Fourier habituelle, par exemple : 
la fonction g définie par l’intégrale (1) est continue et bornée sur 
toute la droite numérique. 
En effet, 


N 
Le ()—e GIE À lente ee] x dr ()+ 
—N 


+ | Le-iux ei | dE (x). 
Ixl>N 
Le deuxième terme du second membre peut être rendu aussi petit 
que l’on veut (à la fois pour À, et À, quelconques), en prenant N suf- 
fisamment grand ; quant au premier, pour À fixé il tend vers zéro, 
lorsque À; — À2 —> 0. 

Cependant, certaines propriétés de la transformation de Fourier 
ne sont plus vraies pour la transformation de Fourier-Stieltjes. Ainsi, 
la transformée de Fourier-Stieltjes d’une fonction F ne tend pas 
nécessairement vers zéro quand | À | — oo. Posons, par exemple, 


0 pour x< 0 


F(2)= | 1 pour x > 0. 
Alors 


g(À)— | e—üs dF (x) —1. 
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De même, la transformée de Fourier-Stieltjes d’une fonction, égale 
à O0 pour x < xo et à À pour x > +0, est e*, c.-à-d. une fonction 
périodique de À. 

Si Fest une fonction des sauts ayant 


n = 0, +1, +2,... 
comme points de discontinuité et 


ss At gs is +. An .… (Dlal<o) 
ñn 


comme valeurs des sauts en ces points, alors 


OO 


| ex dF(x)= D ane i"À 


— © 


est une fonction périodique de période 2x. Si F admet les sauts a, 
aux points z, formant une suite arbitraire de nombres (en général, 
incommensurables), la transformée de Fourier-Stieltjes de F est 
de la forme 


» ane ixnÀ, 
n 


Les fonctions de ce type font partie de la classe des fonctions dites 
presque périodiques. 

2. Applications de la transformation de Fourier-Stieltjes en 
théorie des probabilités. Pour les fonctions sommables sur (—, co) 
nous avons introduit au $ 4 la notion de convolution: 


O0 


FC) = firfe(a)= À fi (e—8 fe (8) d£. (3) 
Posons 
F(x)— | f(t)dt, Fi(x)= | fa(t) dt et Fa(x)— | f2 (0 dt. 


En intégrant l'égalité (3), écrivons-la sous la forme : 


F (x) = (D dt= | a À 169 AE 
|; heat} A4 | r(x—H47, 


(l’interversion des intégrations ici est possible en vertu du théorème 
de Fubini et du fait que la fonction f est absolument intégrable). 
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La relation ainsi obtenue 


F(a)= | Fi(z—E5)dF,(®) 


fait correspondre aux fonctions F, et F: la fonction #. Mais l’inté- 
grale qui figure ici au second membre existe en tant qu'intégrale 
de Lebesgue-Stieltjes non seulement pour les fonctions absolument 
continues, mais aussi pour n'importe quelles deux fonctions à varia- 
tion bornée sur toute la droite numérique. L'expression 


OO 


F(a)= | Fi(a—t)dFe (6) (4) 


-— 00 


où F, et F, sont des fonctions arbitraires à variation bornée sur la 
droite, s'appelle convolution de ces deux fonctions et se note F, x F2. 
Montrons que l'expression (4) est une fonction définie pour toutes 
les valeurs de x et à variation bornée sur toute la droite numérique ). 

En effet, F, est une fonction à variation bornée, donc, mesurable 
au sens de Borel; par conséquent, l'intégrale (4) existe pour tous 
les x. On a donc 


Fe) F(a)1=| | Fier—5) Fier —5) x dE] < 


< | Fi(i—E)—Fi(as—E) | d (var F2 (E)). 


d’où 
VIFI< VIF, - VIFL 


ce qui signifie que F est une fonction à variation bornée. 


Théorème 1. SiFest la convolution des fonctions à variation 
bornée F, et Fa, et g, g1, g2 sont les transformées de Fourier-Stieltjes de 
F, F;, F) respectivement, alors 


g (À) = gi À) ge (À). 
Démonstration. Soit F = F, + F2, et soit 


a = Lg, Lys + + Tn —= D 

1) Dans le livre de V. I. Glivenko « Intégrale de Stieltjes », Gostehizdat, 

1936, est donnée une construction élémentaire qui permet d'attribuer un sens 
à la formule (4), sans utiliser la notion de mesure. 
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une partition du segment la, b]. Alors pour chaque À on a 


n 


b 
\ ex dF(x)= lim > exp (F(xr) —F (xx-1)) = 


max Axy, —+ 0 k—1 


— lim [ 


max Axp 0 


D ei GR (Fi (xr —E) — 
oo k—1 
— Fix — Ë))e 6 dF, (6), 


b 00 b—E 

{e-tx dF (x) = À { | es GF(x) } e$ dF, (E). 
En passant dans cette égalité à la limite pour a — — et b —+ c, 
on obtient 


[ ex GP (x) = [ eh dFi(x) [ ei dF, (E), 


c.-à-d. 
g (à) = g1 (À) 82 (À). 


Le théorème affirmant que la transformation de Fourier-Stieltjes 
remplace la convolution de deux fonctions par leur produit est large- 
ment utilisé en théorie des probabilités méthode des fonc- 
tions caractéristiques). Si £ et n sont deux varia- 
bles aléatoires indépendantes et F, et F, sont leurs fonctions de 
répartition, alors la fonction de répartition qui correspond à Ë +n 


est 
F — F, * Fo. 


La nécessité de considérer des sommes de variables aléatoires 
indépendantes se présente assez souvent en théorie des probabilités. 
Le passage des fonctions de répartition à leurs transformées de 
Fourier-Stieltjes, que l’on appelle encore fonctions caractéristiques, 
permet de remplacer l'opération de convolution par l’opération 
plus simple et plus commode de multiplication. 

Exercices. 1. Démontrer que la transformation de Fourier-Stieltjes 
jouit de la propriété d’unicité : si La fonction F est continue à gauche et sa trans- 
formée de Fourier-Stieltjes est identiquement nulle, alors F (x) — const. 


2. Démontrer que l'opération de convolution des fonctions à variation 
bornée est commutative et associative. 


S 8. Transformation de Fourier des distributions 


Nous avons déjà fait remarquer que l’application de la transforma- 
tion de Fourier au sens habituel à la résolution des équations diffé- 
rentielles et à d’autres questions est limitée en grande mesure par le. 
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fait que cette transformation n’est définie que pour les fonctions abso- 
lument intégrables sur toute la droite numérique. L’applicabilité 
de la transformation de Fourier peut être élargie de façon considé- 
rable, en introduisant la notion de transformation de Fourier pour 
les distributions. Exposons les idées principales d’une telle cons- 
truction. 

Considérons de nouveau l’espace S,k des fonctions indéfiniment 


D! 


dérivables sur toute la droite numérique et décroissant à l'infini 
avec leurs dérivées plus vite que toute puissance de 5 (cf. $ 4, 


chap. IV). 

En prenant S> pour espace des fonctions de base, considérons 
l’espace correspondant des distributions S%. 

Définissons maintenant la transformation de Fourier dans l’es- 
pace S$. Pour cela, rappelons-nous tout d’abord que la transforma- 
tion de Fourier au sens habituel applique l’espace S, dans lui-même : 
si p € S., alors F [ol € S.; de plus, F est une application bijective 
de l’espace S, sur lui-même. Cela étant, introduisons la définition 
suivante. On appelle transformée de Fourier d'une distribution f € SÈk 
la fonctionnelle linéaire g € S% définie par la formule 


Cette formule peut s’écrire encore ainsi : 


Donc, la transformée de Fourier d’une fonctionnelle f € S$ est la 
fonctionnelle dont la valeur pour chaque élément 1 € S+ est égale 
à la valeur de la fonctionnelle initiale (multipliée par 2n) pour 
l'élément ® — F4, où F-lest la transformation de Fourier inverse. 

Puisque % — F [ol parcourt l’espace SX tout entier quand 
parcourt S >, l'égalité (1) définit bien une fonctionnelle sur l’espace 
S tout entier. La linéarité et la continuité de cette fonctionnelle 
sont immédiates. 

Parmi les éléments de S& figurent toutes les fonctions absolu- 
ment intégrables. Pour ces fonctions la notion de transformée de 
Fourier au sens de la définition ci-dessus coïncide avec celle définie 
précédemment. En effet, si f € Sx, ® € So, £ = F [fl et v = F [ol, 
alors d’après le théorème de Plancherel on a 


2x (f, p) = (g, Ÿ); (2) 


en outre, pour f donnée il existe (à l’équivalence près) une seule fonc- 
tion g qui vérifie cette égalité pour tous les @ € S.. Par passage 
à la limite il est aisé de montrer que l'égalité (2) est vraie pour toute 
fonction f € L, (—c, co). Ainsi, la transformation de Fourier des 
distributions est la généralisation de la notion classique correspon- 
dante à une classe d'objets plus large. 
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Exemples. 1. Soit f(x) — c — const. Alors 
O0 


2n(f, p=2r | cp(a)dr=2np(0)  (p=FIe) 


— 00 


Di 


c.-à-d. la transformée de Fourier d’une constante est égale à cette 
constante, multipliée par 2x et par la fonction 6. 
2. Soit f (x) — ex, Alors 


2 (f, 2x | e-iep (x) da = 2x (— 0) 
c.-à-d. la transformée de Fourier de eït* est la fonction à translatée 
Ô (x + a), multipliée par 2x. 
3. Soit f (x) — 2°. En posant dans l'égalité 
D'(A)= — xp (x)e-" dx 
x == 0 et en la multipliant par 2x, on obtient 
2n (2°, p (x) }= —2nÿ" (0); 


donc, la transformée de Fourier de x° est la dérivée seconde de la fonc- 
tion Ô, multipliée par —2x. 

Faisons. pour conclure, les remarques suivantes. 

Nous avons défini la transformation de Fourier pour les distri- 
butions sur S.. Cependant, on pourrait prendre tout autre espace de 
base, par exemple, l’espace X des fonctions indéfiniment dérivables 
à support borné. Pour toute fonction o € Æ la transformée de Fou- 
rier (au sens habituel) existe et, comme on peut le vérifier, est une 
fonction analytique entière à croissance exponentielle. D’une manière 
plus précise, la transformation de Fourier est un opérateur linéaire 
qui applique l’espace À dans l’espace Z ayant pour éléments les 
fonctions analytiques entières 4 dont chacune vérifie les inégalités 


[sr p(s)I<CaeslTl (g=1, 2, ...), 


où T = [Ims,C, et a étant des constantes qui dépendent de w. 

Comme dans l’espace À on a introduit la notion de convergence, 

l'application F de X dans Z induit une notion de convergence dans 

Z; une suite {W#.} converge dans Z vers , si la relation ®, — œ a 

lieu pour les images réciproques correspondantes. D'ailleurs, cette 

notion de convergence peut être facilement formulée, sans faire 

intervenir l'espace Æ 1. 

, _ ns pen Emente Ÿh — 0 dans 7, si pour C,(q = 1, 2, ...) et a fixés on 
| sta (s)| < Ca a 

et Ÿ, — 0 uniformément sur tout intervalle fini de l’axe réel. 

29-0167 
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Soit maintenant f un élément arbitraire de X*. Faisons-lui 
correspondre une fonctionnelle linéaire g sur Z, en posant 


(g, p) = 27 (f, p), où p = F Il. 


Cette fonctionnelle g sera appelée transformée de Fourier de la fonc- 
tionnelle f. Ainsi, la transformée de Fourier d’une distribution f 
sur l’espace de base XÆ est une distribution sur Z, c.-à-d. sur l’espace 
image de À par la transformation de Fourier au sens habituel. 

La même construction est valable aussi pour les distributions 
sur d’autres espaces des fonctions de base. Dans tous les cas on obtient 
un schéma comportant quatre espaces: un espace initial des fonc- 
tions de base, l’ensemble des transformées de Fourier de ces fonc- 
tions (c.-à-d. un deuxième espace des fonctions de base) et deux 


espaces duals. 


ESPACE DES ERPACE DES TRANSFORMÉES 


F 
DISTRIBUTIONS ——+>| DE FOURIER DES DISTRIBUTIONS 


ESPACE DES ESPACE DES TRANSFORMÉES 
FONCTIONS DE FOURIER DES 
DE BASE FONCTIONS DE BASE 


Si l’on prend S, comme espace de base, ce schéma se réduit à deux 
espaces, car la transformation de Fourier applique l’espace S, sur 
lui-même. 

La notion de transformation de Fourier pour les distributions est 
largement utilisée dans la théorie des équations différentielles aux 
dérivées partielles. Pour ces questions le lecteur pourra consulter, 
par exemple, le livre de G. E. Chilov [52]. 


CHAPITRE IX 


Equations intégrales 
linéaires 


$ 1. Principales définitions. Quelques problèmes 
conduisant à des équations intégrales 


1. Types d’équations intégrales. On appelle équation intégrale 
une équation qui contient la fonction inconnue sous le signe d’in- 
tégration. Telle est, par exemple, l’équation 

b 


p()= À Æ (6, #) p(E) de + f (5), (1) 


a 


où f et À sont des fonctions continues et est la fonction inconnue. 
Les variables s et & parcourent ici un segment donné [a, bl. 

La particularité caractéristique de l’équation (1) réside dans sa 
linéairité: elle est linéaire par rapport à la fonction inconnue . 
De nombreux problèmes conduisent à des équations intégrales non 
linéaires, par exemple, à des équations de la forme 


b 
(= [K(s De (pG, 2)dr, 
a 
où À et g sont des fonctions données. Cependant, nous nous borne- 
rons dans toute la suite aux équations intégrales linéaires. 


Certaines équations intégrales ont été considérées déjà au début 
du siècle passé. Ainsi, par exemple, l'équation 


f()= (Pa  (0<a<1, f(0)—0) 
0 


a été considérée en 1823 par Abel et porte son nom. Dans cette équa- 
tion f est une fonction donnée et œ est la fonction inconnue. Abel 
a montré que la solution de cette équation est 


LA 
PO | ds. 
0 


TI 


Cependant, la théorie générale des équations intégrales linéaires 
n’a été construite qu'à la limite des XIX® et XX° siècles, principale- 
ment grâce aux travaux de Volterra, Fredholm et Hilbert. 


29* 
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L'’équation (1) s'appelle équation de Fredholm de deuxième espèce 
(cf. n° 4, $ 4, chap. LU}: l'équation 


Û K(s,t)q(t)dé+f(s)=0 (2) 


a 


(contenant la fonction inconnue @ seulement sous le signe d'’inté- 
gration) s'appelle équation de Fredholm de première espèce. 

L'équation d’Abel, mentionnée plus haut, fait partie des équa- 
tions dites de Volterra ; la forme générale de ces équations est 


ÎÆ( D paf (s) (3) 


(équation de Volterra de première espèce) ou 
p()= À K(s, 1) p(di+f(s) (& 


(équation de Volterra de deuxième espèce). Il est clair que l'équation 
de Volterra peut être considérée comme une équation de Fredholm 
où la fonction K vérifie la condition 


K (s,t) = 0 pour t > s. 


Mais il est plus raisonnable de ranger les équations du type de Vol- 
terra en une classe spéciale, car elles possèdent des propriétés qui 
n’ont pas lieu pour des équations de Fredholm arbitraires. 

Si dans les équations (1), (2) ou (3) la fonction j est nulle, on dit 
qu’une telle équation est homogène. Dans le cas contraire l'équation 
est dite non homogène. 

2. Exemples de problèmes conduisant à des équations intégrales. 
Dans les paragraphes suivants du présent chapitre nous établirons 
les propriétés fondamentales des équations intégrales, mais pour 
l'instant nous nous proposons de considérer quelques problèmes qui 
conduisent à de telles équations. 

4. Equilibre d'une corde chargée. Considérons une corde, c.-à-d. 
un fil matériel élastique et flexible de longueur ! qui oppose à la 
traction une résistance, proportionnelle à la valeur de cette traction. 
Supposons les extrémités de la corde fixées aux points x — 0 et 
x — L. Alors dans sa position d'équilibre la corde coïncide avec le 
segment 0 < x < L de l’axe x. Supposons maintenant que la corde 
soit soumise à une force P — P; qui agit verticalement en un point 
x — €. Sous l’action de cette force la corde s’écarte de sa position 
d'équilibre et prend, évidemment, la forme de la ligne brisée repré- 
sentée sur la fig. 23. 
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Cherchons l'écart Ô de la corde au point £ sous l’action de la force 
P: agissant en ce point. Si la force P4 est petite par rapport à la 
tension 7, de la corde non chargée, alors la tension de la corde chargée 
peut être supposée aussi égale à 7. Cela étant, de la condition d’équi- 
libre de la corde on obtient l’égelité 


d'où 


Désignons par w (x) la flèche de la corde en un point quelconque x 
sous l’action de la force P:. Alors 


u (x) = P:G (x, Ë), 


où 
EE pour OLzxr<eEé, 
G(x, Ë) — ° 
Ge G—x) Ë 
Ti Pour EZSz<|!l 


De ces formules on voit immédiatement que G (x, £) — G (EË, x). 

Supposons à présent que la corde soit soumise à une force répar- 
tie uniformément sur cette corde avec la densité p (£). Si cette force 
est petite, la déformation dépend encore linéairement de la force, 
et la forme de la corde chargée est dé- 


crite par la fonction B 


l 
u(r)= (GC DpE dE. 6) 
0 


Donc, si la charge agissant sur la corde Fig. 23. 
est donnée, la formule (5) permet de 
déterminer la forme prise par la corde sous l’action de cette charge. 

Considérons maintenant le problème inverse : déterminer la répar- 
tition de la charge p telle que la corde ait la forme donnée u. On voit 
alors que pour trouver la fonction p connaissant uw, nous avons une 
équation qui aux notations près coïncide avec l’équation (2), c.-à-d. 
une équation intégrale de Fredholm de première espèce. 

2. Oscillations libres et oscillations forcées de la corde. Supposons 
maintenant que la corde oscille de façon quelconque. Soit uw (x, t) 
la position, à l'instant {, du point de la corde ayant l’abscisse x, 
et soit p la densité linéaire de la corde !). La force d'inertie qui agit 


1) Nous supposons p — const, bien que cela n’ait pas d'importance pour la 
suite. 
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sur un élément de longueur dx de la corde est égale à 
d2u (x, t) 
y Pdr, 
donc 


pŒ=- 26, 


En substituant cette expression à p (£) dans la formule (5), on 
obtient 
l 
O2u (E,t 
u (= — | G(x 1)p DE. (6) 


0 


Supposons que la corde produit des oscillations harmoniques de fré- 
quence constante wo et d'amplitude w (x) dépendant de x. Autrement 
dit, soit 

u (x, t) = u (x) sin ot. 


En portant cette expression dans (6) et en simplifiant par sin wt, 
on obtient pour w l'équation intégrale suivante: 


l 
u (x) — pa? | G(x, É)u(Ë) dE. (7) 
0 


Si, sous l’action d’une force extérieure, les oscillations de la corde 
ne sont plus libres, mais forcées, alors, comme le montre un calcul 
simple, l’équation des oscillations harmoniques de la corde prend 
la forme 


l 
u (a) = pu? | G(x, E)u(E) dé +7 (x), 
0 


c.-à-d. est une équation de Fredholm non homogène de deuxième 
espèce. 

3. Réduction d’une équation différentielle à une équation intégrale. 
Parfois il y a intérêt à réduire la résolution d’une équation différen- 
tielle à la résolution d’une équation intégrale. Par exemple, en démon- 
trant l'existence et l’unicité de la solution de l'équation différen- 


tielle 
y — Î (x, y) 


avec la condition initiale y (xo) — Yo, nous avons vu (au chap. II) 
qu'il est commode de réduire cette équation à l'équation intégrale 
(non linéaire) 


y=vo+ | Î (6; y) dé. 
0 
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Une telle réduction est possible aussi pour des équations d'ordre 
supérieur à un. Considérons, par exemple, l'équation du second 
ordre 


y" +f(x)y = 0. 
En posant f (x) — p? — © (x) où p — const, mettons-la sous la forme 
y" + pfy = 6 (x) y. (8) 


Comme on le sait, la solution de l’équation 
y" + p°y = 8 (x) 


peut s’écrire sous la forme 
x 


y(a)=cosp(æ—a) += sinp(x—t) (Ed. 


a 
Donc, trouver la solution de l'équation (8) revient à résoudre l’équa- 
tion intégrale 


px) | 0 (6) sin p (&—E) y (E) dé = cos p (x — a). 


1 
P 


$ 2. Equations intégrales de Fredholm 


1. Opérateur intégral de Fredholm. Dans ce paragraphe nous 
allons étudier les équations de Fredholm de deuxième espèce, c.-à-d. 
les équations de la forme 

b 
p(s)= | K(s, D p(Od+f(s). (1) 


a 


Toutes les fonctions considérées ici et plus loin seront supposées, 
en général, à valeurs complexes. La fonction X, appelée noyau 
de cette équation, sera supposée mesurable et appartenant à la 
classe ZL, sur le carré a <s,t < b: 


[kçnf'asd< oo. (2) 


Q se, © 


Dans l'équation (1) f est une fonction donnée et œ est la fonction 

inconnue, toutes les deux appartenant à ZL, [a, b]. Les noyaux appar- 

tenant à la classe Z>, s'appellent noyaux de Hilbert-Schmidt. 
Associons à l'équation (1) l'opérateur À défini par l'égalité 


Ag = Ÿ 
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qui se traduit par 
b 
LAS D pd v(s). (3) 


Tout opérateur de la forme (3) s’appelle opérateur de Fredholm. 
Si, en outre, le noyau Æ (s, t) vérifie la condition (2), un tel opéra- 
teur est dit opérateur de Hilberi-Schmidt. Il est évident que l’étude 
de l’équation (1) se réduit à l’étude des propriétés de cet opérateur. 


Théorème 1. L'égalité (3), où K (s,t) est une fonction à 
carré intégrable, définit dans l'espace L: la, b] un opérateur linéaire 
compact À dont la norme vérifie l'inégalité 


D D 
IA <V [ [LA D Fés ar. (a) 


a «a 


Démonstration. Remarquons tout d’abord que l'intégrale 
b 
| |Æ (s, #) dt 
a 


existe, en vertu du théorème de Fubini et de la condition (2) pour 
presque tous les s. Autrement dit, Æ (s, t), comme fonction de #, 
appartient pour presque tous les s à L: la, b]l. Comme le produit 
des fonctions à carré sommable est une fonction sommable, l’inté- 
orale du premier membre de (3) existe pour presque tous les s, c.-à-d. 
la fonction 1 est définie presque partout. Montrons que w € Z, la, bl]. 
En vertu de l'inégalité de Cauchy-Bouniakovsky, pour presque tous 
less on a 


b 
PTONEIESCDTIOE. 


©" 


b 
2< | IE (s 0 Pa |lp@Pa- 


b 


=lglé. (IX (6 D Par. 


a 


En intégrant par rapport à s et en remplaçant l'intégrale itérée de 
| À (s, t) |? par l’intégrale double correspondante, on obtient l’iné- 
galité 


b b b 
laplr= | iptoPas<ien | ÎIX(, DE ds dé 


qui assure à la fois l’intégrabilité de |# (s) |? et l'évaluation (4) 
pour la norme de l’opérateur À. Il reste à montrer que l’opérateur À 
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est compact. Soit {p,} un système orthogonal complet dans Z: [a, bl]. 
Alors l’ensemble de tous les produits 4,, (s) #, (é) constitue un systè- 
me complet dans l’espace L: ([a, b] X La, bl) et, par conséquent, 


K(s,0= 25 amnbm (s) Ÿn (). 
Posons maintenant 
N 
K y (s, t)— : >. AmnŸm (S) Yn () 


et soit À y l’opérateur défini par le noyau Æ, (s, t). Cet opérateur 
est compact, car il applique l’espace Z, [a, b] tout entier sur un 
sous-espace de dimension finie (au chap. IV les opérateurs de ce 
type ont été appelés opérateurs de dimension finie). En effet, si 
€ L: la, b]l, alors 


b N b 
Ax6= | Ke Dpt 5 amnbn(s) | P(E) bn (0) = 
« m, n=1 a 


N N 
— > mn (s) > Amn0nr 
m—i 1 


— 


b 
bn = | p(E) bn (0) de, 


c.-à-d. chaque élément œ € L: la, b] est transformé par l'opérateur 
A, en un élément du sous-espace de dimension finie, engendré par 
les vecteurs 11, . ..,#n. D'autre part, À, (s, {) est une somme par- 
tielle de la série de Fourier de Æ (s, t); c’est pourquoi 


b b 
| | (K(s, t)— KX (5, t))? ds dt 0 quand N — co, 


En appliquant l'évaluation (4) à l'opérateur À — À y, on en déduit. 
que 
| À — À ,|]— 0 quand N — co. 


En vertu du théorème affirmant que la limite d’une suite conver- 
gente d'opérateurs compacts est un opérateur compact, on en conclut 
que l’opérateur À est compact. 

Le théorème est démontré. 

Remarques. {. Au cours de la démonstration du théorème 1 
nous avons démontré que tout opérateur de Hilbert-Schmidt peut 
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être considéré comme la limite (au sens de la convergence en norme) 
d’une suite d'opérateurs intégraux de dimension finie. 

2. Soient À, et À: deux opérateurs de la forme (3), et XA (s, £), 
K: (s,t) les noyaux qui leur correspondent. Si les opérateurs À; 
et À: sont égaux, c.-à-d. si A;p — A9 pour tous les æ € Z, la, bl, 
alors X, (s, t) — K3 (s, t) presque partout. En effet, si 

b 


Aip—4:p— | (A: (s, t) — K (s, t))p(#) di =0 


pour tous les @ € Z: la, b]l, alors pour presque tous les s € [a, blon a 
b 


| LÆi(s, D —Ki(s, t)ldt=0 
et, donc, 


b b 
NET 1) —K;(s, t)ldsdt=0, 


d’où l’on déduit notre affirmation. Donc, si, comme d'habitude, 
on ne fait aucune différence entre les fonctions sommables équiva- 
lentes, on peut dire que la correspondance entre les opérateurs inté- 
graux et les noyaux est biunivoque. 


Théorème 2. Soit À l'opérateur de Hilbert-Schmidt défini 
par le noyau K (s,t). Alors son adjoint A* est défini par le noyau 
« adjoint » K (#, 5). 

Démonstration. En utilisant le théorème de Fubini, 
on obtient 

bb 


Ai 9= | {| KA O&}EG 4 


b 


b b b 
= | | Æ (6, 9 f (#8 0) dt ds — ({[re. D aGiàs } (D dt = 


D 
fo {| K (s, D g(s)ds) di, 


a 


Q © 


d'où l’affirmation du théorème. 

En particulier, un opérateur À de la forme (3) est auto-adjoint 
dans Z, la, b], c.-à-d. A* — À si et seulement si Æ (s, t) — K (4, s). 
Dans le cas où l’espace de Hilbert considéré est réel (et, donc, les 
noyaux sont réels) cette condition prend la forme Æ (s,t) — K (f, s). 
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Remarque. Nous avons considéré jusqu'ici des opérateurs 
intégraux dans L: [a, b]. Pourtant, tout ce qui a été dit plus haut, 
de même que les résultats qui seront exposés plus bas, s'étend sans 
modifications au cas où au lieu du segment [a, b] on prend un espace 
mesuré quelconque. 


2. Equations à noyau symétrique. Considérons l’équation inté- 
grale de Fredholm de deuxième espèce 


b 
p(s)= | K(s Hp di+f(s) (5) 
dont le noyau vérifie les conditions 
b b 
1) [{Ix6s, t) ds dt < ©, 
2) K(s, t)=K (ts). 


Nous dirons qu’une telle équationest à noyau symétrique. D'après 
les théorèmes 1 et 2 du numéro précédent, l’operateur de Fredholm 
correspondant 
b 
Ag — | K (s, t)q(t)dt (6) 
a 
est compact et auto-adjoint. Par conséquent, il vérifie les conditions 
du théorème de Hilbert-Schmidt (n° 5, $ 6, chap. IV). Appliquons 
ce théorème pour trouver les solutions de l'équation (5). Ce qui est 
important pour nous, c’est la propriété de l'opérateur (6) d’être 
compact et auto-adjoint et non sa représentation intégrale; pour 
cette raison, il est naturel d'écrire l’équation (5) symboliquement 


sous la forme 
p= Àp + f. (7) 


D'après le théorème de Hilbert-Schmidt, il existe pour À un système 
orthonormé de fonctions propres {p,} correspondant aux valeurs 
propres non nulles {4, }, tel que chaque élément & de L, peut s’écrire 
sous la forme 


E— D'anÿn+é', où AË'—0. 
Posons | 
f= Dbnbn+f (4f=0) (8) 
et cherchons la solution @ de l’équation {7) sous la forme 
p=2ianbn+q  (4p=—0). (9) 
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En portant les développements (8) et (9) dans l'équation (7), on 
obtient 


2: LTnŸn + P' =2 Ln\nŸn + 2 brŸn + f'. 


Cette égalité est vérifiée si, et seulement si, 


f = 
et 
Zn (—n) = bn (n—=1,2,...), 
c.-à-d. si 
f =", 
Ba = pour Àn 1, 
bn = pour Àn — 1. 


La dernière égalité fournit la condition nécessaire et suffisante pour 
que l'équation (7) soit résoluble. Les coordonnées x, correspondant 
aux n pour lesquels À, — 1 sont arbitraires. Ainsi, on obtient le 
résultat suivant. 


Théorème 3. Si1Â n'est pas une valeur propre de l'opérateur 
À, alors l'équation (7) admet pour tout f une solution et une seule. Si, 
par contre, 1 est une valeur propre de l'opérateur À, l'équation (7) 
est résoluble si, et seulement si, la fonction f est orthogonale à toutes 
les fonctions propres de l’opérateur À qui correspondent à la valeur 
propre 1. Si cette dernière condition est vérifiée, l’équation (7) a une 
infinité de solutions. 

3. Théorèmes de Fredholm. Cas des noyaux dégénérés. Passons 
maintenant à l’étude des équations de Fredholm de deuxième espèce 
dont les noyaux sont soumis à la condition 

b b 
| (IE, 1)? ds di < oo 


a «a 


(qui assure la compacité de l'opérateur), la condition de symétrie 
n'étant pas exigée. 
Considérons d’abord l'équation 


b 
pO)= [KG DpGat+f( (10) 
dont le noyau est supposé dégénéré, c.-à-d. de la forme 


K (s, t) = 2 P; (s) Q: (6), (11) 
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où P;, Q; sont des fonctions de Z». L'opérateur défini par un noyau 
de la forme (11) fait correspondre à toute fonction @ € L; la somme 
b 


> PA(9 | QG p@ar, 
i—1 a 


c.-à-d. un élément du sous-espace de dimension finie, engendré par 
les fonctions P;, i —1,2,...,n. On remarquera que dans (11) 
les fonctions P1, ..., P, peuvent être considérées comme linéaire- 
ment indépendantes. En effet, s’il n’en est pas ainsi, en mettant 
chacune des fonctions P; sous la forme d’une combinaison linéaire 


de fonctions linéairement indépendantes, nous parviendrons à 
représenter le même noyau K (s, t) par la somme d'un nombre plus 
petit de termes de la forme P; (s) @; (t) tels que les fonctions P, 
soient linéairement indépendantes. Une réduction analogue peut 
être appliquée aux fonctions Q;. Il est aisé de voir qu'après ces réduc- 
tions on obtient un noyau tel que les fonctions P;, aussi bien que 
les fonctions @;, sont linéairement indépendantes. 

Ainsi, il s’agit de résoudre l'équation (10) avec le noyau dégéné- 
ré (11), où les fonctions P,,..., P, (de même que @Q,,..., Q,) 
sont linéairement indépendantes. En remplaçant dans l'équation (10) 
K (s,t) par la somme correspondante. on obtient 


TEL | Où (9 p (D dt + f (6). (12) 


i=1 


Avec les notations 
b 


| Q: (ë) p (6) dt = g: 


écrivons l’équation (12) sous la forme 


p(s) = À qiPi(s) + f(s). 


En substituant cette expression à dans l'équation (10), on obtient 


> qiP i(s) + f(s) = 


= DPi(s a eo Sur, O+@]d+10. (413 


i=1 j=1 
En posant 


b b 
(A UP Ode, | QE ve, 
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écrivons l'é rganité (13) sous la à forme 
Zur (s) = CPC 


Comme les fonctions P; sont, par hypothèse, linéairement indépen- 
dantes, on en déduit l'égalité des coefficients correspondants: 
ñn 
Gi } ag; + bi, i — À, 2, ..., n. (14) 
i= 
Nous avons ainsi obtenu un système d'équations linéaires par rap- 
port aux coefficients g;. En le résolvant, nous trouverons la fonction 


p(s)— 2 qiPi(s) +7f(s). 


Cette fonction satisfait à l'équation intégrale (10), car tous les cal- 
culs que nous avons faits pour passer de l’équation (10) au systè- 
me (14) peuvent se faire dans le sens inverse. 

Ainsi, la résolution d'une équation intégrale à noyau dégénéré se 
ramène à la résolution du système correspondant (14) d'équations algé- 
briques linéaires. 

Pour les systèmes d'équations linéaires les conditions d'existence 
et d’unicité de la solution sont bien connues. 

I. Un système d'équations algébriques linéaires 


Tr=y (T=llarl, xz= (as ..., Zn), y=(yr +. Yn)) 


est résoluble si et seulement si le vecteur y est orthogonal à chaque 
solution du système homogène adjoint 


Téz=0 (T*= || a ||). 


II. Si le déterminant de la matrice 7 est différent de zéro, le 
système Tx — y a pour tout y une solution et une seule. Si le déter- 
minant de la matrice Test égal à zéro, le système homogène Tx — 0 
a des solutions non nulles. 

III. Comme la matrice T' et la matrice adjointe T* ont le même 
rang, les systèmes homogènes Tr — 0 et T*z — 0 ont le même nom- 
bre de solutions linéairement indépendantes. 

Grâce à la liaison qui, comme nous l’avons vu, existe entre les 
équations intégrales à noyaux dégénérés et les systèmes d'équations 
algébriques linéaires, ces assertions peuvent être considérées comme 
des théorèmes concernant les solutions des équations intégrales à 
noyaux dégénérés. Nous montrerons au numéro suivant que ces 
mêmes théorèmes ont lieu aussi pour les équations intégrales à 
noyaux arbitraires (non dégénérés). Cependant, comme pour 
les opérateurs intégraux non dégénérés les notions telles que rang 
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d’une matrice et déterminant n’ont pas de sens, il faudra formuler 
les théorèmes correspondants de façon que ces notions n'intervien- 


nent pas. 
4. Théorèmes de Fredholm pour les équations à noyaux non 


dégénérés. Considérons de nouveau l'équation 
b 
pE)= À K(s, D p( d+f (6). (15) 


mais cette fois nous soumettrons son noyau à la seule condition de 
Hilbert-Schmidt 


b b 
| [I +) ds dt < oo 


a 


(assurant la compacité de l’opérateur), sans exiger que ce noyau soit 
dégénéré, ni qu'il soit symétrique. Nous nous intéresserons aux 
conditions de résolubilité de l'équation (15) et aux propriétés de 
ses solutions. L'essentiel pour nous sera la propriété de compacité de 
l'opérateur correspondant à l’équation (15) et non sa représentation 
intégrale. Pour cette raison, dans la suite nous construirons tous 
nos raisonnements à partir de l’équation opératorielle 


p = Ap + f, (16) 


en supposant que À est un opérateur compact arbitraire dans un 
espace de Hilbert FH. 

En posant T — 1 — A (où J est l’opérateur identique), écrivons 
l'équation (16) sous la forme 


To = f. (17) 
À côlé de cette équation considérons encore l’équation homogène 

Topo = 0 (18) 
et les équations adjointes 

Tp= &, (19) 

T#o = 0 (20) 


(T* — TI — A*). La liaison entre les propriétés des solutions de ces 
quatre équations se traduit par les assertions suivantes, dites t h é o - 
rèmes de Fredholm. 

I. L’équation non homogène To = f est résoluble si et seulement sif 
est orthogonal à chaque solution de l'équation homogène adjointe 
To = 0. 

IT. (alternative de Fredholm). Ou bien l'équation 
To = f a pour tout f € H une solution et une seule, ou bien l'équation 
homogène Tps — 0 a des solutions non nulles. 
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III. Les équations homogènes (18) et (20) ont le même nombre 
(fini) de solutions linéairement indépendantes. 

Avant de passer à la démonstration de ces théorèmes, remarquons 
qu'ils sont (d’après ce qui a été dit au n° 2) vrais pour les équations 
à noyau symétrique. Dans ce cas, puisque À et ÀA* coïncident, le 
théorème III devient trivial. 

D'autre part, si À est un opérateur intégral dégénéré, les équa- 
tions intégrales correspondantes se ramènent, comme nous l’avons 
vu plus haut, à des systèmes d'équations algébriques linéaires ; les 
théorèmes de Fredholm se ramènent alors aux théorèmes sur les 
systèmes linéaires, cités au numéro précédent. 

Etant donné que tout opérateur compact est la limite d’une suite 
convergente d'opérateurs dégénérés, c.-à-d. d'opérateurs de dimen- 
sion finie, on pourrait démontrer les théorèmes de Fredholm à l’aide 
du passage à la limite correspondant (des opérateurs dégénérés à des 
opérateurs non dégénérés). Nous suivrons pourtant une autre voie 
et donnerons une démonstration de ces théorèmes sans faire interve- 
nir les opérateurs dégénérés. 

Démonstration des théorèmes de Fred- 
h o 1 m. Rappelons que Ker B désigne l’ensemble des zéros de l’opé- 
rateur linéaire continu B, c.-à-d. l’ensemble de tous les x € Æ tels 
que Br — (0. Il est clair que Ker B est toujours un sous-espace vecto- 
riel fermé. Soit Im B le domaine des valeurs de l’opérateur BP, c.-à-d. 
l’ensemble des vecteurs de la forme y — Bx. L'ensemble Im B est 
aussi une variété linéaire, mais elle n’est pas en général fermée. Nous 
allons montrer que pour l'opérateur T — 1 — À la variété corres- 
pondante est fermée. 


Lemme 1. La variété Im T est fermée. 


Démonstration. Soit y, Elm 7 et y, —+ y. Par hypothèse 
il existe des vecteurs x, € H tels que 


Un = Tln = Xn — Ath. (21) 


Nous pouvons supposer que les vecteurs x, sont orthogonaux à 
Ker T, en retranchant, s’il le faut, de x, sa projection sur Ker T. 
En outre, on peut supposer que les || x,|| forment un ensemble borné, 


car sinon, en passant à une sous-suite, on aurait || x,[| — œ et, en 
Tn Tn 


divisant par || x,||, on obtiendrait de (21) que —— — | 
Tr Il Il Zn | 


Or, comme l'opérateur À est compact, en passant de nouveau à une 
LL e ZT 
sous-suite, on peut supposer que la suite {4 =} est convergente. 
n 


. . TL . 
Mais alors la suite {) va aussi converger, vers un vecteur z € À. 
n 


Il est clair que || z|| — 41 et 72 — 0, c.-à-d. z € Ker 7. Or, puisque 


Lrd 


les vecteurs x, sont supposés orthogonaux à Ker 7, le vecteur z 
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doit être orthogonal à Ker 7. La contradiction obtenue permet de 

supposer que les || x,|| forment un ensemble borné. D'autre part, 

dans ce cas la suite {Ax,} peut être supposée convergente et alors, 

comme cela résulte de (21), la suite {x,} sera aussi convergente. En 

désignant la limite de cette suite par x, on déduit de (21) que y = Tx. 
Le lemme est démontré. 


Lemme 2. L’espace H est la somme directe des sous-espaces 
fermés orthogonaux Ker T et Im T, c.-à-d. 


Ker T @ Im T* — H; (22) 


de même 
Ker T* ® Im T7 = H. (23) 


Démonstration. Nous savons déjà que les deux sous- 
espaces figurant au premier membre de l'égalité (22) sont fermés. 
Ils sont, en outre orthogonaux, car si k € Ker T, on a (k, T*x) — 
— (Th, x) = 0 pour tous les x € H. Il reste à démontrer qu'il n'existe 
aucun vecteur non nul, orthogonal à la fois à Ker 7 et à Im T*. 
Mais si un vecteur z est orthogonal à Im T*, pour tout x € H on 
a (Tz, x) = (2, T*x) = 0, c.-à-d. z € Ker 7. 

Le lemme est démontré. 

Du lemme 2 résulte immédiatement le premier théorème de 
Fredholm. En effet, f L Ker T* si et seulement si f € Im 7, c.-à-d. 
s’il existe o tel que To = f. 

Posons maintenant pour tout 4 entier H* — Im (7"), en particu- 
lier, A! = Im 7. Il est clair que les sous-espaces 4° forment une 
suite décroissante : 


H=H=H#>... (24) 


En vertu du lemme 1, tous ces sous-espaces sont fermés. En outre, 


T (H®) _— HF 


Lemme 3. Il existe un nombre j tel que H°**1 = H"* pour tous 
les k > j. 


Démonstration. Si un tel j n'existe pas, il est évident 
que tous les Æ° sont distincts. Dans ce cas on peut construire une 
suite orthonormée {x,} telle que zx € H" et zx L H**1 Soit 1 > k. 
Alors 


Aty — Aïn = —28 + (xs + Tax — Tai) 


et, par conséquent, || Az; — Axl] > 1, car xy + Tax — Tax, € H°*1, 
Il est donc impossible d'extraire de la suite {Ax;,} une sous-suite 
convergente, ce qui contredit la compacité de l'opérateur A. Ceci 
démontre le lemme. 


30—0167 
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Lemme 4. Si Ker T —={0}, alors Im T = H. 


Démonstration. Si Ker T —{0}, l'opérateur T7 est 
bijectif et, par conséquent, si en outre Im T = JA, la suite (24) est 
constituée de sous-espaces distincts, ce qui contredit le lemme 3. 
Donc, Im T7 — H. De même, si Ker T* —{0}, on a Im T* — }. 


Lemme 5. Si Im T = H, alors Ker T —{0}. 


Démonstration. Comme Im 7 — }H, en vertu du lem- 
me 2, on a Ker T* —4{0}, mais alors, d’après le lemme 4, Im T* — 
— H et, par conséquent, selon le lemme 2, on a Ker 1 — {0}. 

Les lemmes 4 et 5 constituent précisément le contenu du deuxième 
théorème (de l’alternative) de Fredholm. Ce théorème est donc dé- 
montré. 

Démontrons, enfin, le troisième théorème de Fredholm. 

Supposons que le sous-espace Ker T soit de dimension infinie. 
Alors dans ce sous-espace il existe un système orthonormé infini 
{x,}. En outre, Az, = x, et donc pour k =£ l'on a || Axx — Ax;l| = 
— V2. Mais il est impossible d'extraire de la suite {Ax,} une sous- 
suite convergente, ce qui contredit la compacité de l'opérateur À. 

Désignons par u la dimension de Ker T et par v celle de Ker T*. 
Supposons que u << v. Soient {P41, . . ., ,} une base orthonormée 
dans Ker T et {w, ..., w,} une base orthonormée dans Ker T*. 


Posons 


L 
Sxz=Tx +2 (x, Dj) Vj. 


Comme l'opérateur S s'obtient de l’opérateur T par adjonction 
d'un opérateur de dimension finie, tous les résultats, établis plus 
haut pour l'opérateur T7, sont valables aussi pour l'opérateur S. 

Montrons que l'équation Sx = 0 n’a pas de solution, autre que 
la solution triviale. En effet, supposons que 


u 
Ta + 2 (z, Ps) Ÿ; = 0. (25) 


Comme, en vertu du lemme 2, les vecteurs 4%; sont orthogonaux 
à tous les vecteurs de la forme Tr, de (25) il résulte que 


Txz = 0 


et 
(x, p) = 0 pour 1<j<u 


C'est pourquoi, d’une part, le vecteur x doit être une combinaison 
linéaire des vecteurs w; et, d’autre part, il doit être orthogonal à ces 
vecteurs. Par conséquent, x — 0. Donc, l'équation Sx — 0 n’a 


6 2] ÉQUATIONS INTÉGRALES DE FREDHOLM 467 


pour solution que la solution triviale. Mais alors, d’après le deuxième 
théorème, il existe un vecteur y tel que 


u 
Ty+ 2 (Pi) Vi us 


En multipliant les deux membres de cette égalité scalairement par 
Ÿ+s, nous obliendrons 1 à droite et 0 à gauche, car Ty EIlmT et 
Im 7 1 Ker T*. Cette contradiction provient de la supposition 
que u <Z v. Par conséquent, u > v. En remplaçant l'opérateur T 
par T*, nous obliendrons que u < v; donc, u = wv. 

Le théorème IIT est complètement démontré. 

Remarques. 1. Dans les théorèmes de Fredholm il s’agit, 
en fait, de l’inversibilité de l’opérateur À — 1. Ces théorèmes mon- 
trent que À — 1 est pour l’opérateur À soit une valeur régulière, soit 
une valeur propre de multiplicité finie. Certainement, tout ce que 
ces théorèmes affirment est vrai aussi pour l’opérateur À — AJ, si 
À == 0. Aïnsi, {out point différent de Ô du spectre d’un opérateur com- 
pact est une valeur propre de multiplicité finie de cet opérateur. Nous 
savons, en outre, que l’ensemble de telles valeurs propres est au plus 
dénombrable. Rappelons, à ce propos, que le point O0 appartient 
toujours au spectre d'un opérateur compact dans un espace de 
dimension infinie, mais n’est pas nécessairement une valeur propre 
de cel opérateur. Les opérateurs compacts dont 0 est le seul point 
du spectre s'appellent opérateurs (abstraits) de Volterra. 

2. Nous avons démontré les théorèmes de Fredholm pour une 
équation de la forme @ — A + f, où À est un opérateur compact 
dans un espace de Hilbert. Ces théorèmes peuvent être généralisés 
sans modifications importantes au cas d’un espace de Banach ar- 
bitraire Æ£. Dans ce cas, bien sûr, l'équation adjointe d — A“*v + g 
est une équation dans l’espace E*, la condition d’orthogonalité 
(f, Vo) — 0 signifie que l'élément f € Æ annule toute fonctionnelle 
du sous-espace Ker T* € £* des solutions de l'équation T*ÿo = 0, 
etc. Un exposé des théorèmes de Fredholm pour des équations dans 
un espace de Banach est donné, par exemple, dans le livre de 
L. Lusternik el V. Sobolev « Eléments d'analyse fonctionelle » 
(en russe). 

9. Equations de Volterra. On appelle équation de Volterra (de 
deuxième espèce) l’équation intégrale 


@ (s) — | K (s,t)œ(t) dt + f (s), (26) 


où Æ (s, t) est une fonction mesurable bornée: | K(s, 4 | < M. 
Comme celte équation peut être considérée comme un cas particulier 
de l'équation de Fredholm (dont le noyau est nul pour { > s), les 
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théorèmes de Fredholm sont vrais aussi pour l'équation (26). Mais 
pour les équations de Volterra ces théorèmes peuvent être précisés 
de la manière suivante. Pour toute fonction f € L: l’équation de Vol- 
terra (26) a une solution et une seule. 

En effet, si l’on reprend mot pour mot les raisonnements du n° 4, 
$ 4, chap. IT, il est aisé de voir qu'il existe une puissance de l’opé- 


rateur 
S 


4ag= | K (s, 1)@(#) dt 


qui représente un opérateur contractant et, par conséquent, l’équa- 
tion homogène a une solution unique (la solution triviale). En vertu 
des théorèmes de Fredholm, on en déduit l’assertion annoncée. 


Exercice. Soit une équation intégrale de Fredholm de deuxième espèce 
à noyau continu, donnée sur un segment. Démontrer pour une telle équation les 
théorèmes de Fredholm dans l’espace des fonctions continues. Pour «équation 
adjointe » on prend l’équation intégrale à noyau transposé, et l’orthogonalité 
est comprise au sens de L». 


6. Equations intégrales de première espèce. On appelle équa- 
tion abstraite de Fredohlm de première espèce une équation de la forme 


A — f, (27) 


£c.-à-d. une équation ne contenant la fonction inconnue œ@ que sous 
le signe d’un opérateur compact. 

La résolution d’une telle équation est un problème, en général, 
plus compliqué que celui de la résolution d’une équation de deuxième 
espèce et l'équation (27) ne peut pas être résoluble pour tout 
second membre. 

Considérons d’abord, comme un exemple simple, l'équation 

S 


F9= [et &, 
c.-à-d. l'équation de noyau 
1 pour i<5, 


K (6, n={ O0 pour >s. 


Elle a une solution évidente œ (s) — f’ (s), si la fonction f est abso- 
lument continue et sa dérivée appartient à L:, et n’a aucune solution 
dans le cas contraire. 

Montrons que dans le cas général aussi l’équation (27) ne peut 
pas être résoluble pour f € H arbitraire. En effet, la résolubilité de 
l'équation Ag — f pour tout f € H signifierait que cet opérateur 
applique H sur H tout entier. Montrons que cela est impossible. 
L'espace H tout entier peut être considéré comme une réunion 
dénombrable de boules S$S, (par exemple, des boules de rayon 
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1, 2,...,n, ... et de centre au point 0). L'opérateur compact À 
applique chacune de ces boules dans un ensemble compact. Donc, 
AH est une réunion dénombrable de compacts. Or, dans H tout 
compact est nulle part dense ; d’autre part, l’espace A, comme tout 
espace métrique complet, ne peut pas être représenté par une réunion 
dénombrable d’ensembles nulle part denses. Donc, AH - H; en 
d’autres termes, quel que soit l’opérateur compact À dans H, l’équation 
Aqg = f ne peut pas être résoluble pour tous les f € H. 

Un autre fait important consiste en ce que l'inverse d’un opéra- 
teur compact n’est pas borné. Donc, si f, et f2 sont deux éléments 
voisins appartenant à Æ et les deux équations 


Ai = fi  AÀAPe — fo 


sont résolubles, leurs solutions correspondantes ; — AÀ71f, et po — 
— Alf, peuvent être très différentes l’une de l’autre. Autrement 
dit, une erreur aussi petite que l’on veut sur le second membre peut 
conduire à une erreur aussi grande que l’on veut sur la solution. 
Les problèmes, dans lesquels un changement petit des données 
initiales conduit à un changement petit de la solution (cette « peti- 
tesse » peut avoir un sens différent dans des problèmes différents), 
s'appellent problèmes corrects. La résolution d’une équation intégrale 
de première espèce (par opposition à celle d’une équation de deuxième 
espèce) est un problème incorrect. Divers problèmes incorrects et les 
méthodes de leur régularisation (c.-à-d. de leur réduction à des 
problèmes en un certain sens corrects) ont reçu ces derniers temps un 
développement considérable. Mais l'exposé de ces questions dépasse 
le cadre du présent ouvrage 


$ 3 Equations intégrales dépendant d’un paramètre 
Méthode de Fredholm 


1. Spectre d’un opérateur compact dans H. Considérons l'équa- 
tion 
p = ÀAG + f 
ou, sous une autre forme, 
(1 — AA) p — f, (1) 


où À est un opérateur compact dans l’espace de Hilbert Æ et À est 
un paramètre numérique. 

En vertu de l'alternative de Fredholm, deux cas s’excluant 
mutuellement (et deux seulement) sont possibles : 

1. Pour chaque f € H et À donné l’équation (1) a une solution 
et une seule. 

_ L'équation homogène ® — ÀAp admet des solutions non 
nulles. 
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Dans le premier cas l'opérateur Z — À A applique biunivoquement 
I sur tout entier. On en déduit l’existence de l’opérateur inverse 


borné (J — 14)". Cela équivaut à dire que l'opérateur (4 — +1) h 


est borné et défini sur À tout entier ; autrement dit, dans ce cas L 


n'appartient pas au spectre de l’opéraiteur À. 
Supposons maintenant qu'on ait la deuxième possibilité, c.-à-d. 
qu'il existe un élément non nul 1 € H tel que 


{ 
P—=ÀAp, ou AP = 7 Pa; 


| , # 
alors + est une valeur propre de l'opérateur À. 


On obtient donc le résultat suivant: fout nombre un — T0 


est soit une valeur propre de l'opérateur compact À, soit une valeur 
régulière. Autrement dit, le spectre continu d’un opérateur compact 
est soit vide, soit constitué du seul point u = 0. 

En ajoutant ce qu’on vient de dire au théorème 4, $ 6, chap. IV, 
on obtient la description suivante du spectre d’un opérateur compact 
dans Æ. Le spectre de tout opérateur compact À dans Æ est constitué 
du point 0!) et d’un nombre fini ou d’une infinité dénombrable 
de valeurs propres non nulles 4, >, . . ., Un, . . . dont chacune est 
de multiplicité finie. Le point 0 est le seul qui peut être un point 
d’accumulation de la suite {u,}. Le point u — 0 lui-même peut être 
une valeur propre de multiplicité finie ou infinie, mais il peut aussi 
ne pas appartenir à l’ensemble des valeurs propres. Comme cela a été 
montré au n° 9, $ 2, pour l'équation 


P = ÀBp + f, 


où B est un opérateur intégral du type de Volterra, on a toujours la 
première possibilité de l'alternative de Fredholm (résolubilité pour 
tout f € L:). Autrement dit, le spectre d’un opérateur intégral du type 
de Volterra est constitué du seul point u — 0. Par ailleurs, à la fin 
du n° 4, $ 2, nous avons appelé opérateur abstrait de Vollerra un opé- 
rateur compact dont le spectre se réduit au seul point O0. On peut 
donc dire qu'un opérateur intégral de Volterra cest en même temps 
un opérateur abstrait de Volterra, de sorte que toute cette terminolo- 
gie se trouve justifiée. 

2. Recherche de la solution sous forme d’une série de puissances 
de À. Déterminants de Fredholm. Formellement la solution de 
l'équation 

(—2AA)q =} 


1) Le point u — 0 appartient nécessairement au spectre de l’opérateur 4. 
car À 1 ne peut pas être borné dans À 
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peut s’écrire sous la forme 
p=(Z—RA)iÿ. (2) 
Cette formule définit bien la solution, si [| AA [| 1, c.-à-d. si | À | < 


TZ TT car dans ce cas l'opérateur (7 — À14)71 existe, est défini 


sur {1 tout entier et est borné (cf. n° 7, $ 5, chap. IV). En outre, 
l'opérateur (71 — ÀA)-1 peut être considéré comme la somme de la 
série entière 

(l— AA) I=I+RAA+NA4 +... HANTAT+ ..., 
dont la convergence (en norme) est assurée par la condition | À | < 
< CT . Par conséquent, la solution (2) de l’équation (1) peut s’écrire 


ainsi : 
p= f + AAf + A2AÏÿ +... + AMAN +... (3) 


On obtient le même résultat, si l’on cherche la solution de l’équa- 
tion (1) sous la forme 


Pa = Po + AP + +. + An +... 


(où p\, ne dépendent plus de À). En substituant cette série à @ dans 
les deux membres de l'équation @ — À Ag + f et en identifiant les 
coefficients des mêmes puissances de À, on obtient 


Po = f, Pa Àf, ..., On — APn-1 = À", ..., 


c.-à-d. la série (3). 

Montrons que si À est un opérateur intégral de Hilbert-Schmidt, 
c.-à-d. un opérateur défini par un noyau Æ (s, t) à carré intégrable, 
alors pour des valeurs de À suffisamment petites l'opérateur (7 — 
— ÀA)7! peut être représenté par la somme Z + ÀT (à) de l'opérateur 
identique JZ et d’un opérateur intégral de Hilbert-Schmidt AT (À) 
dont le noyau est à carré intégrable et dépend du paramètre À. Cher- 
chons d’abord comment on écrit les noyaux des opérateurs 4°, 4*, 
etc. Pour cela, considérons le problème plus général suivant: étant 
donné deux opérateurs intégraux 


b b 
Ao= | K(s,t)o(t)dt, Bo— | Q(s,t)o(t) dt, 


[K (s, t)F ds dt=—k?< oo, 


LQ(s, t)P ds dt = < oo, 
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trouver le noyau de l’opérateur AB. On a 


b b 
AB — | {K(s u) | Qu, ?) @(e) dt} du = 


us &œ 


-[ {| K(s,u)Q(u, 1) du } op (#) dt. 


La possibilité d’intervertir ici l’ordre des intégrations résulle du 


théorème de Fubini, car la fonction à intégrer 
Æ (s, u) Q (u, t) p () 


est sommable par rapport à uw et & simultanément, comme produit 
de deux fonctions 


K(s, u)() et Qu, i) 


dont chacune a le carré sommable. 
Posons 


b 
R (s, »= | K(s, u)Q(u, t) du: (4) 


d’après l’inégalité de Cauchy-Bouniakovsky on a 
b 


D 
LA (DFE À LK (6, u) Pau À 1Q(u, 9 fau, 


b b 
| | LR (s, t)Pds dk. 
a «a 


Ainsi, le produit de deux opérateurs intégraux du type de Hilbert- 
Schmidt est un opérateur du même type dont le noyau est défini 
par la formule (4). En particulier, si l’on pose À — B, on voit que 4° 
est un opérateur intégral dont le noyau 

b 

K, (s, = | K(s,u)K(u, t)du 

a 
vérifie la condition 
b 


ÎIK(, D Pasat | =, 
a 


Q nn) 


| K2(s, t)Pdsdi<| 


d’où 
II AI<#* 
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avec 
b 


= | 


a 


[X (s, t) ds dt. 


R rs © 


De la même manière on peut montrer que chacun des opérateurs 
A” est défini par le noyau 


b 
K,(s, = | Kaas u)K(u,t)du (n=2, 3, ...) 
vérifiant la condition 
b b 
| [An (s, #) Pas di < k. (5) 
Les noyaux X, (s, t) s'appellent noyaux itérés. 
Pour | À | < | la série 


K(s,1)+AK:(s,t)+...LATIK A (s, it) + ... 


converge dans l’espace Z, (la, b] X La, b]), en vertu de l'évaluation 
(9), vers une fonction T'(s, t; À) dont le carré est sommable par 


rapport à s et { pour tout |A | < : . L'opérateur intégral [ (à) 
dont la fonction ['(s, 1; À) sert de noyau est la somme de la série 
convergente 
A+AA?+...HATIATE ... (6) 
d'opérateurs compacts; par conséquent, il est lui-même compact. 
En multipliant cette somme par À et en lui ajoutant l'opérateur 
identique 7, on obtient l'opérateur (7 — AA) !. Donc, pour | À | < 
< J l'opérateur (7 — 14)! est bien la somme de l'opérateur iden- 
tique Z et de l’opérateur ÀT (À) ayant pour noyau la fonction 


AT (s,t; À)— D A'Ka(s,t). 
n—=1 


.. l . . a . 
La condition | À | < 7 est suffisante, mais pas nécessaire, pour 


la convergence de la série (6). Dans certains cas cette série peut 
s'avérer convergente même pour toutes les valeurs de À. Par exemple, 
si À est un opérateur du type de Volterra dont le noyau vérifie la 
condition 

|ÆK(sS D I< MN, 
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alors, comme le montre un calcul direct, pour les noyaux itérés 
K, (s,t) on a l'évaluation 
Mn (b—aÿn-1 


d’où l’on déduit que la série (6) est convergente pour tout À. 

Mais la série (6) a, en général, un rayon de convergence fini. 
D'autre part, l'équation @ — À Ag + f est résoluble pour toutes les 
valeurs de À, sauf pour un nombre fini ou une infinité dénombrable, 


plus précisément, sauf pour les valeurs de À telles que . est valeur 


propre de l’opérateur À. Fredholm a montré que pour un opérateur 
intégral À, défini par un noyau borné el continu X(s, t), 
la solution de l'équation ® — A4 + f peut être trouvée de la maniè- 
re suivante. Introduisons la notation 


K (s, L) . K (si, În) 
4 +. Sn 
K _|........... 

hoc. ln 
et définissons les fonctions D (à) et D (s, t; À), appelées respective- 
ment déterminant de Fredholm et mineur de Fredholm, par les formu- 
les : 

b : b 
4 1 A? 

D(i)=1 A |k(E ) dE + + | 


a a 


+ | eff Eat. (7) 


a 


D(st:)=K F2 


n 
#{] 


t E1 Ëe 
à D b s É é 
n n 1 CCS] n ] 
, L 2 L 1 + ( TT 1) n | L2 L] L2 K F ë, | | | l dé, L 2 e L 1 dEn TT L2 L] L] (8) 


Alors le noyau résolvant de l’équation intégrale 


b 
PG)= A | K(s, 9) p (6) dt+7 (5) 
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est défini par la formule 
'(s,t; pi 26iin 2 


D (à) 


et la solution de cette équation s’écrit sous la forme 


b 
(= (+2 | GE; (9 de (9) 


a 


pour toules les valeurs de À telles que _ n'est pas valeur propre de 


l'opérateur À correspondant au noyau Æ (s, t). En outre, D (à) et 
D (s,t; À) sont des fonctions analytiques entières du paramètre À et 


D (à) = 0 si et seulement si 2 est une valeur propre de l’opérateur 


intégral À. Comme l’a montré T. Carleman en 1921, les formules (7), 
(8) et (9), obtenues par Fredholm sous l’hypothèse que le noyau 
K (s, t) est continu, sont vraies de même pour tout noyau à carré 


intégrable. Nous n’exposons pas ici la démonstration des 
formules (7), (8) et (9) !. 


1) Cf. T. Carleman, Zur Theorie der Integralgleichungen, Math. 
Zeitschr. 9 (1921), 196-217, ainsi que F. Smithies, The Fredholm theory 
of integral equations, Duke Math. Journal, 8 (1941), 107-130. 

Pour la démonstration des formules (7), (8) et (9) cf. [35] et [36]. 


CHAPITRE X 


Eléments de calcul différentiel 
dans un espace vectoriel 


Dans les questions d’analyse fonctionnelle dont nous nous som- 
mes occupés aux chapitres précédents les notions principales étaient 
celles de fonctionnelle linéaire et d’opérateur linéaire. Cependant, 
certaines questions qui se posent en analyse fonctionnelle sont essen- 
tiellement non linéaires ; c’est pourquoi à côté de l’analyse fonction- 
nelle « linéaire » on doit développer aussi l’analyse fonctionnelle 
« non linéaire », c.-à-d. étudier les fonctionnelles non linéaires et les 
opérateurs non linéaires dans des espaces de dimension infinie. 
A l’analyse fonctionnelle non linéaire on peut rapporter, par exemple, 
une branche si classique des mathématiques qu'est le calcul des 
variations dont les bases furent jetées déjà aux siècles XVII-X VIII, 
grâce aux travaux de Bernoulli, Euler, Legendre. Pourtant, dans 
son ensemble, l'analyse fonctionnelle non linéaire constitue une 
branche relativement nouvelle des mathématiques qui est encore 
loin d’être achevée. Dans ce chapitre nous allons exposer quelques 
notions premières se rapportant à l'analyse fonctionnelle non linéaire, 
notamment à la théorie de la différentiation, ainsi que quelques 
applications de ces notions. 


$ {. Différentiation dans un espace vectoriel 


1. Différentielle forte (différentielle de Fréchet). Soient X et Y 
deux espaces vectoriels normés et F une application d’un ouvert O de 
X dans Ÿ. Nous dirons que cette application est différentiable en un 
point donné x E O, s’il existe un opérateur linéaire borné Z, € 


E L (X, Ÿ) tel que 
F(&+h)—F(x) =Lh+tal(x, h), (1) 


La (x, k) 1] 
LA 


L'expression L,h (qui représente évidemment un élément de l’espa- 
ce Ÿ, quel que soit k € X) s'appelle différentielle forte (ou différen- 
tielle de Fréchet) de l'application F au point x. L'opérateur linéaire 
L,; lui-même s'appelle dérivée ou, plus précisément, dérivée forte 


— 0 quand ||] — 0. (2) 
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de l’application F au point x. Nous désignerons cette dérivée par 
F" (x). 
Si l'application F est différentiable au point x, la dérivée cor- 
respondante est définie de façon unique. En effet, soit 
F(z+h)—F(x)=LPh+ou(x, h)=LEh+a(x, h); 
alors 
LPh—LPh—=oa(x, h)—œ(x,h) 


et, en vertu de la relation (2), on a 


ET quand || || +0. (3) 
Or, si L? =£ L?, il existe À tel que 
LR — LE |] 
I |] 
Mais alors pour tout 0 on a 
IL (eh) — Li (eh) Il à 
ILex 1] | 


= À =£ 0. 


de sorte que la relation (3) est impossible. 

Nous établirons maintenant quelques résultats élémentaires qui 
découlent directement de la définition de la dérivée. 

4. Si F (x) = yo = const, alors F' (x) = 0 (c.-à-d. dans ce cas 
F" (x) est l’opérateur nul). 

2. La dérivée d’une application linéaire continue L est cette appli- 
cation même. 

En effet, d’après la définition on a 


L(x+h)— L(x) = L(h). 


3. (Dérivée d'une fonction composée.) Soient X, Ÿ, Z trois espaces 
vectoriels normés, U (x0) un voisinage du point x0 € X, F une applica- 
tion continue de ce voisinage dans Y, yo = F (xo), V (yo) un voisinage 
du point yo € YŸ et G une application continue de ce voisinage dans Z. 
Alors si l’application F est différentiable au point x, et G est dijféren- 
tiable au point yo, l'application H — GF (qui est définie et con- 
tinue sur un voisinage du point x,) est différentiable au point xçeton a 


H° (20) = G (yo) F” (x): (4) 
En effet, d’après les hypothèses admises, on a !) 


F(to+Ë)=F (to) + F'(xo) 6 + 01 (Ë) 


1) Ici et plus loin les expressions de la forme o(Ë) désignent des grandeurs 
(de l’espace normé correspondant ou numériques) vérifiant la condition 
Il o (€) || 


— 0 lorsque 0. 
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et 
G (go +1) = G (yo) + G’ (yo) N + 02 (n). 


Or, F” (xo) et G” (yo) sont des opérateurs linéaires bornés. Par consé- 
quent, 


H (to + Ë) = G (yo + EF (to) 6 +01 (E)) =G (yo) + G”° (yo) (F” (to) E + 
+ 01 (E)) + 02 (F” (Xo) 6 +0: (£)) = G (Yo) + G” (Yo) F” (to) +03 (£). 


Si F,Get H sont des fonctions numériques, la formule (4) se réduit 
à la règle habituelle de dérivation d’une fonction composée. 

4. Soient F et G deux applications continues de X dans Y. SiFetG 
sont différentiables au point xo, alors les applications F + G et aF 
(où a est un nombre) sont aussi différentiables en ce point et on a 


(F + G) (to) = F' (to) +-G" (x), (9) 
el 
(aF)" (xo) = aF" (xo). (6) 


En effet, de la définition des opérations donnant la somme de 
deux opérateurs et le produit d’un opérateur par un nombre il résulte 
immédiatement que 


(PF + G) (oh) = F (20h) 46 (0h) = 
= F (%0) + G (to) HF" (xo) h—+-G” (to) h Ho (h) 
et 
QF (xo+h) =aF (x) +aF” (to) h+-02 (h), 


d’où l’on déduit les égalités (5) et (6). 
2. Différentielle faible (différentielle de Gâteaux). Soit de nou- 
veau F une application définie sur une partie de X et à valeurs dans 
Y. On appelle différentielle faible ou différentielle de Gâteaux de l’ap- 
plication F au point x (pour l’accroissement h) la limite 
F(c+th)—F(x) 
t 


d 1 
DF (x, h) = pr: F(xz+th)|1=0 = Lim , 
où la convergence est considérée par rapport à la norme de l’espace Y. 
La différentielle faible DF (x, h) peut ne pas être linéaire par 
rapport à À. Si, tout de même, cette linéarité a lieu, c.-à-d. si 


DF(x, h)=F;(x)h, 


où F; (x) est un opérateur linéaire borné, cet opérateur s'appelle 
dérivée faible (ou dérivée de Gâteaux). 

Remarquons que pour les dérivées faibles le théorème de la 
dérivation d’une fonction composée est, en général, faux. (Donner 
un exemple!) 
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3. Formule des accroissements finis. Soit O un ensemble ouvert 
dans X et soit [x,, x] un segment contenu tout entier dans ©. Soit, 
enfin, F une application définie sur O, à valeurs dans Ÿ et ayant en 
tout point du segment [x,, xl une dérivée faible F;. Posons Ax — 
— x — x, et considérons la fonction numérique 


f () = p (F (xo + tAx)), 


définie pour 0 <+t 1, où p est une fonctionnelle arbitraire de Y*. 
Cette fonction est différentiable par rapport à t. En effet, dans l’ex- 
pression 


f(t+At)—f(t) F (x0 + tAz + At La Got 14) 
At = + | At 


on peut passer à la limite sous le signe de la fonctionnelle linéaire 
continue œ. Ceci fait, on obtient 


JE) = p(F;(xo+-tAx) Az). 


En appliquant à la fonction f sur [0, 1] la formule des accroisse- 
ments finis, on obtient 


f(1)—f(0) = (6), où 0<L6<1, 
C.-à-d. 
p(F (x) —F (x)) = p(F; (x + 0Ax) At). (7) 


Cette égalité est vraie pour toute fonctionnelle @ € Y* (la valeur 
de 6 dépend, bien sûr, de œ). De (7) on déduit que 


[PCF (x) —F (to)) | pl: Su, IL F7 (xo+ 8Ax) [1-1] Axil. (8) 


Choisisons maintenant la fonctionnelle non nulle œ de façon que 
Ep (F (x) — F (xo)) = PIE (x) — F (xo)|| 


(une telle fonctionnelle existe en vertu du théorème de Hahn- 
Banach}). Alors de (8) on obtient 


EF (x) — EF (to) [1 Sup. Il F;(xo+0Ax)||-IAx|| (Ax=x—%0). (9) 
Cette formule peut être considérée comme l’analogue de la formule 


des accroissements finis pour les fonctions numériques. 
En appliquant la formule (9) à l’application 


x F(x) —F;(xo) At, 
on obtient l'inégalité suivante: 


EF (x) — F (co) — F5 (x0) Azll< sup | F; (to+ 04) — F5 (x) [+1 Ax ||. 
(10) 
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4. Relation entre les notions de différentiabilité faible et forte. 
La différentiabilité faible et la différentiabilité forte sont des notions 
différentes même dans le cas des espaces de dimension finie. En effet, 
du cours d'analyse on sait bien que pour une fonction numérique 


Î () — Î (ti, …...) Zn); 


où n > 2, l'existence de la dérivée 
d 
—i@+th) 


pour tout k — (h;, ..., h,) fixé n’entraîne pas la différentiabilité 
de cette fonction, c.-à-d. la possibilité de mettre l'accroissement 
f(x +h) — f (x) sous forme d’une somme contenant sa partie prin- 
cipale (linéaire par rapport à k) et un terme infiniment petit d'ordre 
supérieur par rapport à À. Un exemple simple illustrant ce phéno- 
mène est fourni par la fonction de deux variables 


aies 2 9 si (Zi, To) = (0, 0), 
ACTEDES Sue (11) 
0, Si (%4, to) — (0, 0). 


Cette fonction est continue partout sur le plan, y compris le point 
(0, 0). Au point (0,0) sa différentielle faible existe et est égale à O, car 
.  (O+ th) — j (0) 14hho 
D 10 ÉCRIRE 


Néanmoins, cette différentielle n’est pas la partie principale de 
l'accroissement de la fonction (11) au point (0, 0). En effet, si l’on 
pose À; — h}, on obtient 


— h$ 
lim JCwh)—f(0,0) | 0 
Cependant, lorsque l’application F a une dérivée forte, elle a aussi 


une dérivée faible et ces deux dérivées coïncident. En effet, pour une 
application fortement différentiable on a 


F(x+th) — Fix) = F' (x) (th) + o (th) = tF° (x) k + o (th) 


et 


F(z+ ee, —F(x) 0 26 


— F'(x)h+———F" (x) h. 
Cherchons maintenant. à quelles conditions la différentiabilité 
faible de l’application F entraîne sa différentiabilité forte. 


Théorème 1. Si la dérivée faible F};(x) de l'application F 
existe dans un voisinage U du point x, et représente dans ce voisinage 
une fonction (opératorielle) de x, continue en xo, alors l'application F 
a au point x, une dérivée forte F' (xo) qui coincide avec sa dérivée 


faible. 
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Démonstration. Par hypothèse l'application F a une 
dérivée faible, c.-à-d. DF (xo, h) = F; (xs) h. En choisissant À de 
façon que x, + th € U pour tous les £ € [0, 1], considérons l’expres- 
sion 

© (Xo, R)= EF (to+h)— F (to) — F5 (to) À. (12) 


Si y* est un élément arbitraire de l’espace Y *, dual de Ÿ , en vertu 
de (12), on a 


(@ (20, À), y*) = (F (to h) —F (x), y*) — (F5; (%o) k, y*). (13) 
Considérons la fonction f (t) = (F (xo + th), y*) de la variable 
numérique {. Elle est différentiable par rapport à é et 


= lim (ÉTEINT, y*) = (F;(xo+th) h, y*). 
L  At,0 Ât 


Donc, en appliquant à f la formule des accroissements finis, on peut 
écrire l'égalité (13) sous la forme 


(© (to, À), y) = (F5 (to + Th) — F3 (to) h, y°), (15°) 


où test un nombre dépendant de h, 0 < t < 1. Pour À fixé on peut 
choisir l'élément y* € Y* de façon que {| y*|] — 1 et qu'on ait 
l'inégalité 


@ (ro 2), 125110 Go 2) Ile = 5110 ro À) IL 


De Ià et de l'égalité (13) on obtient l'évaluation 
© (to, A) 21 77 (ro + Th) — F5 (to) 1-1 R I. 


Or, par hypothèse, F; (x) est une fonction opératorielle de x continue 
au point æ,; on à donc 


lim |] Fi (oh) —F; (a) || = 0, 


ce qui signifie que || © (to, »)|| est un infiniment petit d'ordre supé- 
rieur à un par rapport à || Al, c.-à-d. que F; (xs) h est la partie 
principale de la différence F (x, + h) — F (x). Ceci prouve 
l'existence de la dérivée forte F” (xo), de même que sa coïncidence 
avec la dérivée faible. Dans la suite, sauf indication du contraire, 
nous allons considérer seulement des applications possédant des 
dérivées fortes et, donc, des dérivées faibles. 

5. Fonctionnelles différentiables. Nous avons introduit la notion 
de différentielle d’une application, définie sur une partie d’un espace 
normé X et à valeurs dans un autre espace normé Y. La dérivée F” (x) 
d’une telle application est pour chaque x un opérateur linéaire de X 
dans Ÿ, c.-à-d. un élément de l’espace Z (X, Y}). En particulier, 
si Ÿ est la droite numérique, alors F est une fonction numérique 
31-0167 


482 CALCUL DIFFÉRENTIEL DANS UN ESPACE VECTORIEL [Ch. X 


sur X, c.-à-d. une fonctionnelle. La dérivée d’une telle fonctionnelle 
en un point x, est une fonctionnelle linéaire (dépendant 
de x), c.-à-d. un élément de l’espace X*. 

Exemple. Dans un espace de Hilbert réel Æ considérons la 
fonctionnelle F (x) —|| x|[. Alors 


x + A — xl = 2, À) + AI; 


2 (x, h) est la partie principale (linéaire par rapport à h) de cette 
expression; par conséquent, 
F'(x)=F;=— 27. 


Exercice. Déterminer la dérivée de la fonctionelle || x|| dans un espa- 
ce de Hilbert. 


(Réponse:  Siz 0; pour x = 0 la dérivée n'existe pas.) 


Les 
1x |] 

6. Fonctions abstraites. Supposons maintenant que c’est l’espace 
de départ X qui se réduit à la droite numérique et soit Ÿ un espace 
de Banach. L'application F (x) faisant correspondre à un nombre x 
un élément de Ÿ, s'appelle fonction abstraite. La dérivée F” (x) d'une 
fonction abstraite (si elle existe) est (pour chaque x) un élément de 
l’espace Ÿ ; c’est le vecteur tangent à la courbe F (x) au point cor- 
respondant. Pour une fonction abstraite (puisqu'elle est fonction 
d’une variable numérique) la différentiabilité faible coïncide avec 
la différentiabilité forte. 

7. Intégrale. Soit F une fonction abstraite d’une variable réelle # 
à valeurs dans un espace de Banach Y. Si Fest définie sur un seg- 
ment [a, b], il est possible de définir l'intégrale de la fonction F sur 
[a, b]. Par cette intégrale on entend la limite des sommes intégrales 


n—1 


0 F (2) (Éx+1 — tx) 


k=— 
correspondant aux partitions 
a=t LL... in = 0, Ex Eli, tra, 


lorsque max ({p+1 — tr) — 0. On désigne l'intégrale (qui est, évi- 
demment, un élément de Ÿ) par le symbole 

b 

| F (t)dt. 


a 


Des raisonnements qui sur beaucoup de points sont analogues à 
ceux qu’on utilise pour les fonctions à valeurs numériques montrent 
que l'intégrale d’une fonction continue sur un segment existe; elle 
possède, en outre, les mêmes propriétés que l'intégrale habituelle de 
Riemann. Parmi ces propriétés citons les suivantes. 
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4. Si Uest une application linéaire continue donnée de l’espace Ÿ 
dans un espace Z, alors 


b b 
(ur@a=u | Fat. 


2. Si F (é) est de la forme f (t) yo, où f (£) est une fonction numé- 
rique et y, est un élément donné de Ÿ, alors 


b 
F(t)dt= yo À F (E) dt. 


3. | 


8 2 > 


b 
roal< {1r ed. 


Soient de nouveau X et Ÿ des espaces normés et soit BC (X, Y) 
l'espace vectoriel des applications continues et bornées 1!) de X 
dans Y. Dans l’espace BC(X, Y) on peut introduire une topologie, 
en prenant pour voisinages de zéro les ensembles 


Une={F: sup IF (x)11<e). 


Sur le sous-espace £ (X, Y) & BC(X, Y) des applications linéaires 
continues de X dans Ÿ cette topologie coïncide avec la topologie 
habituelle sur Z(X, Y), définie par la norme opératorielle. Soit 
J = [xo, xo + Axl un segment de droite dans X. Supposons qu’on 
a donné une application continue de ce segment dans l’espace 
BC (X, Y}), c.-à-d. qu'à chaque point x € J on a fait correspondre 
une application F (x) € BC (X, Y) dépendant continûment du para- 
mètre x € J. Alors on peut définir l'intégrale de F (x) sur le seg- 
ment J, en posant 
xo—+Ax 1 
F(x) ax= | F(xo+tAx) Az dt (14) 
0 


X0 


(ici F (xo + tAx) Axest pour chaque £ € [0, 1] un élément de l’espa- 
ce Ÿ ; c’est l’image de l'élément Ax € X par l’application F (xo + 
+ 4Ax)). Il est clair que l'intégrale figurant au second membre 
de (14) existe et qu’elle est un élément de l’espace Y. 

Utilisons cette notion pour reconstituer une application à partir 
de sa dérivée. 


1) Une application F: X —+ Y est dite bornée, si pour tout ensemble borné 
Q « X l’ensemble F (Q) est borné dans Y. Une application continue non 
linéaire n’est pas nécessairement bornée. 


31* 
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Considérons une application F de X dans Ÿ ayant sur le segment 
[xo, To + Axl une dérivée forte F” (x) qui dépend continûment de x. 
Xo+Ax 
Alors il existe l’intégrale | F"' (x) dx. Montrons qu'on a l’éga- 
lité L 
xo+Ax 
| F'(x)dr = F (t0+ Az) —F (x) (15) 
XO 


qui généralise la formule de Newton-Leibniz. En effet, par définition 
on a 


xo—+Ax n—1 
| F'(x)dr=lim PF (to) (Az) (bn — tx) = 
X0 6-0 R=0 
n—1 
= lim > F' (xx) (Axa), 
ô—+0 k—Q 
où 


Te = Lo tit, Atp = (tur1 — tx) Ax et 
Ô — ra x (lp44 — ln). 


D'autre part, pour toute partition du segment 0 <t<1 on a 


n—1 
F(2x0+Ax)— F (x) — > LF (to + trr4Nt) — F (x + tx Ax)] — 
k—0 
n—1 
= D LF (tx) —F (a)]. 
k—0 
En vertu de la formule (10), on obtient 
n—1 
[D CF Gene) — F (a) — F' (2) Au] | 
n—1 
<IAZI D Great) sup Il F' (ar + A2) — F' (x)|l. (46) 


Comme la dérivée F” (x) est continue et, donc, uniformément conti- 
nue sur le segment [xo, xo + Axl, le second membre de l'inégalité 
(16) tend vers zéro, lorsqu'on diminue indéfiniment les intervalles 
de la partition du segment [x5, zo + Axl. Ceci prouve l'égalité (15). 

8. Dérivées d’ordre supérieur. Soit F une application différen- 
tiable de X dans Y. Sa dérivée F” (x) est pour tout x € X un élément 
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de £ (X, Y), c.-à-d. F” est une application de l’espace X dans l’espa- 
ce des opérateurs linéaires Z (X, Ÿ). Si cette application est diffé- 
rentiable, sa dérivée s’appelle dérivée seconde de l’application F et 
se note F”". Donc, F” (x) est un élément de l’espace Z (X, £ (X, Y)) 
des opérateurs linéaires de X dans Z (X, Ÿ). Montrons que les élé- 
ments de cet espace peuvent être interprétés d’une façon plus com- 
mode et intuitive comme applications bilinéaires. 

Nous dirons qu’on a une application bilinéaire de l’espace X 
dans l’espace Ÿ, si à tout couple ordonné d'éléments x, x” de X 
on a fait correspondre un élément y — B (x, x’) € Y de façon que 
les deux conditions suivantes soient remplies : 

1) quels que soient les éléments x1, z2, x,, x, de X et les nombres 
aetf,ona 


B (ax + Pre, x) —aB (x, x,) + BB (x, &;), 
B (x, ax, +Pzr;)=aB (x, x,) + BB (x, 2); 
2) il existe un réel positif M tel que 
18 (x, << M: ze 21, (17) 


quels que soient x, x” € X. 

La première de ces conditions signifie que l'application B est 
linéaire par rapport à chacune des variables x et x”; il est aisé de 
voir que la deuxième de ces conditions équivaut à la continuité 
de B par rapport à l’ensemble de ses variables. 

Le plus petit des nombres M vérifiant la condition (17) s'appelle 
norme de l’application bilinéaire B et se note || B||. 

Les opérations linéaires sur les applications bilinéaires se défi- 
nissent comme d'habitude et jouissent des propriétés habituelles. 
Par conséquent, les applications bilinéaires de X dans Ÿ forment 
elles-mêmes un espace vectoriel normé que nous désignerons par 
B (X°, Y). Si l’espace Y est complet, B (X*°, Y) l’est aussi. 

A tout élément À de l’espace Z (X, Æ(X, Y)) on peut faire 
correspondre un élément de B (X°?, Y}), en posant 


B (x, x‘) = (Ax) x’. (18) 


Il est évident que l'application ainsi définie est linéaire. Montrons 
qu'elle est aussi isométrique et applique Z (X, Z (X, Y)) sur l’espace 
B (X°, Y) tout entier. En effet, si y — B (x, x’) — (Ax) x’, on a 
y SI Az 2 SA AA ZI 21 

d'où 

BI 1 A: (19) 
D'autre part, lorsqu'une application bilinéaire B est donnée, l’ap- 
plication x’ — (4x )x' — B (x, x') est, pour x € X fixé, une appli- 
cation linéaire de X dans ÿ. 
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Ainsi, à tout x € X on fait correspondre un élément Ax de l’espa- 
ce Z(X, Y); il est évident que Ax dépend linéairement de x, de 
sorte que l’application bilinéaire B définit un élément À de l’espace 
L(X, L{X, Ÿ)). Ilest clair, en outre, que l’application B peut être 
reconstituée à partir de À à l’aide de la formule (18) et que 


lAxfl= sup ||(4x)2’[= sup | B(x, 211 B1-z 
x 1<1 x’ 1<1 
d’où 
I AI SIT BI. (20) 
En comparant (19) et (20), on conclut que || Al] =[| B||. Aïnsi, la 


correspondance entre B (X°, Y) et Z(X, Æ(X, Y)), définie par la 
formule (18), est linéaire et isométrique, donc biunivoque. En outre, 
l’image de l’espace Z(X, Z(X, Y})) est B (X°?, Y) tout entier. 

Nous avons vu que la dérivée seconde F” (x) est un élément de 
l’espace Z(X, £(X, Y}). D'après ce qu’on vient de dire, F” (x) 
peut être considérée comme un élément de l’espace B (X°?, Y). 

Considérons un exemple élémentaire. Soient X et Ÿ deux espaces 
euclidiens de dimensions m et n respectivement. Alors toute applica- 
tion linéaire de X dans Ÿ peut être donnée à l’aide d’une matrice 
à n lignes et m colonnes. Donc, la dérivée F” (x) de l’application F 
de X dans Y est une matrice (dépendante de x € X). Si les bases dans 
X et Ÿ sont choisies, par exemple, 


Ey, +, Em dans À 


et 
f1, : : «, În dans Ÿ, 


on à 
T = T6 + Leo +... + Lmêms Y = Yifa + Yale Fe + + + Ynin. 
L'application y — F' (x) peut donc s’écrire sous la forme 
Y1 —= F; (1, . Tm); 


Un — Fn (x, , Tm) 

et 

Oys Oy1 Oy1 

Ôxy Oo ÔXm 

F' (x) CS 

OYn VYn OYn 

Ôx1 Oro Ütm 
La dérivée seconde F” (x) est définie dans ce cas par le système de 

d?yh = 
nxXxm xXm grandeurs üz, ;j = EPP Un tel système de gran- 
17") 


deurs üz, ;; peut être considéré comme une application linéaire 
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de l’espace X dans l’espace Z (X, Y), définie par la formule 


m 
De, ji — à a, ijl is 
E— 


ou comme une application bilinéaire de X dans Ÿ, définie par la 
formule 
m 


Yh—. D : Ah, ijliT;. 
1, 2—= 


Il est naturel d'introduire la notion de dérivée troisième, quatriè- 
me et, plus généralement, de dérivée n-ième d’une application F 
de X dans Ÿ , en définissant la dérivée n-ième par récurrence comme 
dérivée de la dérivée (n — 1)-ième. Il est clair qu'’alors la dérivée 
n-ième de # est un élément de l’espace Z(X, Z(X, ..., 
Æ(X, Y)...)). En reprenant les raisonnements faits pour la 
dérivée seconde, on peut associer de façon naturelle à chaque élé- 
ment de cet espace un élément de l’espace NV (X, Y) des applica- 
tions n-linéaires de X dans Ÿ. Par application n-linéaire on entend 
une correspondance y = N(x', x”, ..., x°®) entre les systèmes 
ordonnés (x’,x”, ..., x”) d'éléments de X et les éléments de 
l’espace Ÿ possédant les propriétés suivantes : 

1) elle est linéaire par rapport à chacune des variables x quand 
les autres sont fixées ; 

2) il existe un nombre M >> 0 tel que 


IN", 27,..., a) < MN Re. Mari 


Ainsi, la dérivée n-ième d’une application F peut être considérée 
comme un élément de l’espace N (X7, Y). 

9. Différentielles d’ordre supérieur. Nous avons défini la diffé- 
rentielle (forte) d’une application F comme l’image d’un élément 
h,E X par l'opérateur linéaire F” (x), c.-à-d. dF — F" (x) h. On défi- 
nit la différentielle d'ordre deux de F par la formule d?F — 
— F'(x) (h, h), c.-à-d. comme l'expression quadrati- 
que qui correspond à l'application F" (x) € B (X°, Y). D'une 
façon générale, on appelle différentielle d'ordre n de F l'expression 
d'F — F® (x) (h, h, ..., h), c.-à-d. l’image dans Y d’un élément 
(h, F ..., MEX XX X...X X = X" par l'application 
F® (x). 

10. Formule de Taylor. La différentiabilité forte d’une applica- 
tion F signifie que la différence F (x + h) — F' (x) peut être décom- 
posée en une somme de deux termes dont l’un linéaire par rapport 
à k et l’autre infiniment petit d'ordre supérieur par rapport à || k||. 
Ce fait se généralise en une formule analogue à la formule de Taylor 
pour les fonctions numériques. 
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Théorème 2. Soit F une application d'un ouvert O0 X 
dans Y telle que F'" (x) existe et représente une fonction de x, unifor- 
mément continue sur O. Alors on a-l’égalité 


F(a+k)—F(0)= EF" (a)h+ 3 Fe) (RH) + 
+00 (x) (Re, .…., R+o(x, D), (21) 
où ||o (x, k)|| = o (I »||”). 


Démonstration. On va procéder par récurrence sur n. 
Pour n — 1 l'égalité (21) est évidente. Considérons une valeur quel- 
conque de net supposons que la formule qui s'obtient de (21), lors- 
qu’on y remplace nr par nr — 1, soit démontrée pour toutes les appli- 
cations satisfaisant aux conditions du théorème avec n — 1 au lieu 
de n. Alors pour l’application F” on a 


F'(c+h)= EF" (x) + EF" (x) k 4 F" (a) (Rs + 
+ pr EG) ee, 2, (22) 


où || @1 (x, h)|| = 0 (|[k ||"). En intégrant les deux membres de (22} 
sur le segment [x, x + h] et en appliquant la formule de Newton- 
Leibniz (15), on obtient 

1 


F(x+h)—F (x)— | F'(x-+th)h dt — 
0 


1 
_ Î {Fr (x) +4" (x) ST PE" (2) (he, +. 
0 


+ TT PF (x)(h,..,h)}hdt+Rn (23) 


1 


où An = | o(x, th)h dt. 
De (23) on déduit que 
F(a+h)—F(a)=F' (oh F(e)(h, +. 
+ F0 (x) (he, 2, R)H Ra 


1 


M RAUISIT Hoi Gs 2) 1 Id = 0 (1e 1): 
0 
Le théorème est donc démontré. 
La formule (21) s'appelle formule de Taylor pour les applications. 
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$ 2. Problèmes d’extremum 


L'un des problèmes les plus anciens et les mieux étudiés de l’ana- 
lyse fonctionnelle non linéaire est le problème des extremums des 
fonctionnelles. L'étude de tels problèmes fait l’objet du calcul 
des variations. La plupart des méthodes utilisées en calcul 
des variations dépendent de la forme particulière des fonctionnelles 
dont on cherche les extremums. Toutefois, certains procédés et 
résultats généraux peuvent être formulés pour des fonctionnelles 
plus ou moins arbitraires. N’ayant pas l’intention de donner ici 
un exposé tant soit peu complet des méthodes variationnelles, nous 
nous bornerons à étudier en bref quelques éléments de la théorie 
générale qui se trouvent à la base du calcul des variations. 

1. Condition nécessaire pour l’existence d’un extremum. Soit F 
une fonctionnelle réelle définie sur un espace de Banach X. On dit 
que la fonctionnelle F admet au point xo un minimum, si pour tous 
les x assez voisins de x, on a F (x) — F (xo) > 0. On définit de maniè- 
re analogue le maximum d’une fonctionnelle. Si la fonctionnelle F 
admet au point x, un minimum ou un maximum, nous dirons qu'elle 
admet en ce point un extremum. 

De nombreux problèmes de physique et de mécanique peuvent 
être réduits à la recherche des extremums d’une fonctionnelle. 

Dans le cas des fonctions de r variables, pour l’existence d’un 
extremum on a, comme on le sait, la condition nécessaire suivante : 
lorsqu'une fonction différentiable f admet au point xo — (x, x, . .. 

.., 4) un extremum, alors en ce point on a df — 0 ou, ce qui 
revient au même, 


Cette condition s’étend facilement aux fonctionnelles sur un espace 
normé arbitraire. 


Théorème 1. Pour qu'une fonctionnelle différentiable F 
présente au point x, un extremum, il faut que sa différentielle en ce 
point soit nulle pour tous les h: 


F'(x)h = 0. 


Démonstration. D'après la définition de la différen- 
tiabilité on a 


S'il existe un h tel que F” (x) k = 0, alors pour des valeurs réelles 
assez petites de À le signe de l’expression F” (x0) (Ah) + 0 (Ah) coïnci- 
de avec le signe de sa partie principale F” (xo) (Ah). Or, comme 
F" (x0) est une fonctionnelle linéaire, on a Æ” (xo) (Ah) = À F" (xo) À. 
Par conséquent, si F” (xo) h =£ 0, l’expression (1) peut prendre, pour 
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des valeurs suffisamment petites de », aussi bien des valeurs positives 
que des valeurs négatives, de sorte que la fonctionnelle F ne peut pas 
avoir d’extremum au point Zoe 
Examinons quelques exemples. 
1. Soit 
b 
F(æ)= | f(t, x ()) dt, (2) 


a 


où f est une fonction continüment différentiable. Cette fonctionnelle, 
considérée sur l’espace C [a, b] des fonctions continues sur le seg- 
ment [a, b], est différentiable. En effet, 
b 
F(e+h)—F(x)= | If, 24h) ft s)1dt= 
b 


= (fi x) (D dt+0(h), 
d’où ‘ 
b 
dF = | ft, z())h(b) dt. 


a 


Si cette fonctionnelle linéaire est nulle pour tous les k€ C Ia, bl, 
alors f, (t, x) — 0. En effet, quel que soit x (t) € C La, b], la dérivée 
fx (t, x) est une fonction continue de {. Donc, si elle est différente 
de zéro en un point to, par exemple, si f, (to, & (to)) >> 0, cette inéga- 
lité a lieu aussi dans un voisinage («, B) du point {,. Alors en posant 


G— ax) (B—i) pour a <Lt< hp, 
k © = À 
O0 pour les autres #, 


on obtient 
b 


| LG, x)h(b) dt > 0. 


a 


La contradiction obtenue confirme notre assertion. L'’équation 
fx (t, x) = 0 définit, en général, une courbe, sur laquelle la fonction- 
nelle (2) peut présenter un extremum. 
2. Sur le même espace C [a, b] considérons la fonctionnelle 
b b 


F(x)= | ÜK(, 8) 2 (61) z (60) dés dé, (3) 


a «a 


où À (E,, £) est une fonction continue vérifiant la condition 
K (6,6) — K (&2, 61). Il est aisé de voir que la différentielle de cette 
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fonctionnelle est égale à 
b b 
aF=2 À Ÿ K(Es 8) x (En À (E2) dés dé. 


Si cette expression est nulle pour tout k € C La, b], en reprenant les 
raisonnements de l'exemple 1, on verra que 


b 
À A (Es Fa) 2 (Es) dés —0 


pour tous les &, € [a, b]. L'une des solutions de cette équation est 
la fonction x = 0. Ÿ a-t-il extremum en ce point? La réponse à cette 
question dépend de la fonction ÆX (Ë:1, 62) et exige une étude plus 
approfondie. 

3. Considérons la fonctionnelle 


b 
F()= Ÿ 1 200, x’ (0)&, (4) 


définie sur l’espace C! [a, b] des fonctions continûment différentiables 
dx (t) 
dt 

tion deux fois différentiable. La fonctionnelle (4) joue un rôle très 
important dans de nombreuses questions du calcul des variations. 
Cherchons sa différentielle. En vertu de la formule de Taylor, on a 


F(x+h)—F(x)= 
b 


= | [GE zh, x'+h)—f(t, x, x')]dt— 


a 


sur le segment [a, b]. Ici x’ (t) — et f (&, x, x’) est une fonc- 


b 
_ | (fh + feh") dt +o(| ||), 


a 


où || k|| est la norme de la fonction », considérée comme élément de 
l’espace C1 [a, b]. Ainsi, la condition nécessaire pour que la fonction- 
nelle (4) présente un extremum s'écrit sous la forme 


b 
ar = | (fh+-jsn") dt=0. (5) 


Sous la forme intégrale (5) cette condition n’est pas commode pour 
la recherche du point x € C1 [a, b], où il y a extremum. Réduisons-la 
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à une forme plus commode, en intégrant par parties !) le terme 
f'xh" dans (5). On obtient 


b b b 
jh a=pun]- | n <a. 
a a a 


Donc, 


—0. (6) 


b b 
= ((£- fe) hat 


Cette égalité doit avoir lieu pour tous les k, y compris ceux qui véri- 
fient la condition À (a) —h .. — (0. Par conséquent, 
b 


| (# — fs) hdt=0 


pour tous les À tels que h (a) — h (b) — 0. En raisonnant comme 
dans l’exemple 1, on en déduit que 


, d ,, 
fx — 7 fx =0. (7): 
L'égalité (6) se réduit donc à 
b 
fxh| =0. (8): 


Si la fonctionnelle (4) est considérée sur l’ensemble de toutes les 
fonctions continûment différentiables x, définies sur [a, b], on peut 
choisir » de façon que k (a) = 0, h (b) 0 et alors l'égalité (8) donne 


fx L_ = TT 0; ? (9) 
de même, en posant k (b) — 0, k (a) = 0, on obtient 
fx’ 4, = 0 ° (10) 


Ainsi, de la condition (6) (c.-à-d. du fait que la différentielle de la. 
fonctionnelle s’annule) il résulte que la fonction x qui correspond 
à un extremum de la fonctionnelle (4) doit vérifier l’équation diffé- 
rentielle (7) et les conditions aux limites (9) et (10). La solution 
générale d’une équation différentielle du second ordre contient deux 
constantes arbitraires et nous disposons justement de deux condi- 
tions aux limites pour calculer ces constantes. 

2. Différentielle seconde. Conditions suffisantes pour l’existence 
d’un extremum. Revenons sur la recherche de l’extremum d’une 
fonction de n variables. Soit f (x4, . . ., x,) une fonction vérifiant 


1) Cette opération doit être encore justifiée, car l'existence de la dérivée x” 
qui apparaît, dans l’expression Hi fx n’est pas supposée. À ce propos on peut. 


consulter n’importe quel manuel de calcul des variations. 
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au point (x°, ..., xr) la condition df = 0. Alors, pour savoir si la 
fonction f admet ou non un extremum en ce point, il faut considérer, 
comme on le sait, la différentielle seconde de f. Plus précisément, 
on a les propositions suivantes. 

4. Si la fonction f (x, ..., x) admet au point (x, . .., x) 
un minimum (resp. un maximum), elle vérifie en ce point la condition 
df > 0 (resp. d°'f < 0). 


2. Si la fonction f (x, . . ., æ,) vérifie au point (af, . . ., æn) les 
conditions 
df = 0 et d*f — 2 nom Ti dTr > 0 


{pourvu que dx; ne soient pas tous nuls), elle admet en ce point un 
minimum (resp. un maximum si d?f << Ü). 

Bref, pour l’existence d’un minimum il faut que la diffé- 
rentielle seconde soit non négative et il suffit qu'elle soit 
définie positive. 

Voyons maintenant, dans quelle mesure ces résultats peuvent 
être étendus aux fonctionnelles définies sur un espace de Banach. 


Théorème 2 Soit F une fonctionnelle réelle, définie sur 
un espace de Banach X et admettant au voisinage d'un point xo une 
dérivée seconde continue. Si cette fonctionnelle admet au point xo un 
minimum, on a dF (xs) > 0. 


Démonstration. D’après la formule de Taylor on a 
[4 1 " 


Si la fonctionnelle F admet en x, un minimum, on à F" (xs) — 0 et 
l’égalité précédente s'écrit sous la forme 


À pr 
F(to+h)— F(%0) = 3 F(xo) (h, hk)+o (I RP). (11) 
S'il existe un élément À tel que 
F'(xo)(h, h) < 0, (12) 


alors, puisque F” (xo) (eh, eh) — e°F” (xo) (h, h), il existe des À 
vérifiant la condition (12) et ayant la norme aussi petite que l’on 
veut. Or, pour des À suffisamment petits en norme le signe de l’ex- 


pression (11) est défini par le signe du terme SF" (to) (k, h). Par 
conséquent, 
F (th) — F(x0) = F"(&0) (Re, k)+o (|| ]P) < 0, 
c.-à-d. la fonctionnelle F n’a pas de minimum en #,. 


1) Cette inégalité signifie que F” (xo) (k, h) > 0 pour tous les . 
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Un théorème analogue peut être énoncé pour le maximum. 

Le théorème démontré est une généralisation directe du théorème 
correspondant pour les fonctions d’un nombre fini de variables. 
Il n’en est plus de même, lorsqu'il s’agit de la condition suffisante. 
La condition F” (to) (k, h) > 0 qui, comme on l’a déjà mentionné, 
est suffisante pour l'existence d’un minimum dans le cas d’une 
fonction de # variables, n’est plus suffisante dans le cas des fonction- 
nelles définies sur un espace de Banach de dimension infinie. Consi- 
dérons un exemple simple. Soit la fonctionnelle 

O0 O0 
F(= À Sa 


n=1 


définie sur un espace de Hilbert. La différentielle première de cette 
fonctionnelle au point O0 est nn sa différentielle seconde en ce 


point est égale à la série 2 sh 2 T° c.-à-d. représente une fonction- 


nelle définie positive. Toutefois, ‘la fonctionnelle F n’a pas de mini- 
mum au point 0, car F (0) —=0 et F (0, ..., O, Z_, 0, ...)— 
ne, mr” 


n— 1 
= 5 — TL < 0, ce qui signifie que tout voisinage du point 0 
contient des points pour lesquels F (x)  F (0). 
Introduisons la notion suivante. Une fonctionnelle quadratique B 
est dite fortement positive, s'il existe une constante c > 0 telle que 


B (x, x) > c|| xl? pour tous les x. 


Théorème 3. Si une fonctionnelle F, définie sur un espace 
de Banach X, vérifie les conditions 

1) dF (xo) —= 0, 

2) d’F (xo) est une fonctionnelle quadratique fortement positive, 
elle admet au point xo un minimum. 


Démonstration. Choisissons e > 0 de façon que pour 
| AI]  e la quantité o qi h]||?) figurant dans l'égalité (11) vérifie la 


condition Le (A) < + LA Alors 
F (04h) —F (20) = F" (to) (, k)+0(]R IP) > 
>ZURP>O pour [AÏ<e. 
Dans un espace de dimension finie une forme quadratique est 


fortement positive si et seulement si elle est définie positive; c’est 
pourquoi la condition que la différentielle seconde soit définie posi- 
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tive (si en plus la différentielle première est nulle) est une condition 
suffisante pour que la fonction admette un extremum. Dans un espace 
de dimension infinie la condition que la différentielle seconde soit 
fortement positive est (comme le montre l’exemple ci-dessus) plus 
restrictive que la condition qu'elle soit définie positive. 

La condition de positivité forte de la différentielle seconde qui 
assure l’existence d’un minimum est commode grâce au fait qu'elle 
peut être appliquée à toute fonctionnelle deux fois différentiable 
(indépendamment de sa forme concrète) sur tout espace de Banach. 
Mais, d'autre part, cette condition est trop grossière et difficile 
à vérifier dans des cas importants pour la pratique. Dans le calcul 
des variations on établit des conditions suffisantes plus fines d’extre- 
mum (utilisant la forme concrète des fonctionnelles qui interviennent 
dans les problèmes du calcul des variations), mais ces questions 
dépassent le cadre du présent ouvrage. 


$ 3. Méthode de Newton 


Une méthode bien connue de résolution des équations de la forme 
f (x) = 0 (1) 


(où f est une fonction numérique de variable numérique, définie sur 
un segment [a, b]) est la méthode de Newton (ou la méthode des tan- 
gentes). Elle consiste à chercher les approxi- 
mations successives de la solution à l’aide de 
la formule de récurrence 

Lan Ln — on (2) 
(pour approximation initiale x, on prend un 
point arbitraire du segment où la fonction f 
est définie). Le sens géométrique de cette mé- 
thode est illustré par la figure 24. On peut- 
montrer que si x* est la seule racine de 
l'équation (1) sur le segment [a, b] et la fonc- 
tion f admet sur ce segment une dérivée pre- Fig. 24 
mière non nulle et une dérivée seconde bornée, 
alors il existe « un champ d'attraction de la racine x* », c.-à-d. 
un voisinage du point x* tel que pour tout point x de ce voisinage 
la suile (2) converge vers x*. 

La méthode de Newton peut être étendue aux équations opéra- 
torielles. Nous l’exposerons ici pour les équations dans un espace 
de Banach. 

Considérons l'équation 


À! 


F (x) = 0, (3) 
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où Fest une application d’un espace de Banach X dans un espace de 
Banach Y. Supposons que l'application F soit fortement différen- 
tiable dans une boule B (x,, r) de rayon r (dont le centre x, sera pris 
pour approximation initiale de la solution cherchée). En remplaçant, 
comme dans le cas d’un espace de dimension 1, l’expression F (xo) — 
— F (x) par sa partie principale, c.-à-d. par l’élément F” (xo) (xo—2), 
on obtient de (3) l’équation linéaire 
F° (to) (to — x) = F (x) 
dont la solution 
ti = Lo —[F" (x) F (0) 


peut être considérée comme l’approximation suivante de la solution 
exacte x de l'équation (3) (l'existence de l'opérateur [7 (x,)]"! ici 
est, bien sûr, supposée). En reprenant les mêmes raisonnements, on 
obtient la suite 


Znu = Tn —[F" (za) (F (x) (4) 


des solutions approchées de l’équation (3). Dans un espace de dimen- 
sion infinie la recherche de l'opérateur inverse [F” (x,)]"! peut être 
un problème assez compliqué. Pour cette raison il est plus commode 
d'utiliser la méthode modifiée de Newton (cf. (27, 281). La modifica- 
tion réside dans le remplacement de la suite (4) par la suite 


Taxi = Zn —[F" (xo)]"! (F (Zn)). (9) 


Dans ce cas l’opérateur inverse [F” (xo)]"! est pris chaque fois pour la 
même valeur de la variable x — xs. Bien que cette modification 
diminue la rapidité de la convergence, elle est souvent commode 
pour les calculs pratiques. Donnons maintenant un énoncé rigoureux 
de l’assertion en question, de même que sa démonstration. 


Théorème 1. Soit F une application fortement différentiable 
dans une boule B (xo, r) de centre x, et de rayon r, dont la dérivée 
F" (x) satisfait dans cette boule à la condition de Lipschitz: 


| FE’ (x) —F (T2) IS Z | Ti — Lo ||. 
Supposons que [F' (xo)l”! existe et soit 
M =|(F" (to) 11, k=[IEF" (Go)! F(xo)|, k= MEL. 


Alors, si k< +, dans la boule) || x — xoll < kto, où to est La plus 


petite des racines de l'équation ht? — 1 + 1 = 0, il existe une racine 
unique x* de l'équation F (x) — 0 et la suite {x,}, définie par la formu- 
le de récurrence (5), converge vers cette solution. 
Démonstration. Considérons dans l’espace X l’applica- 
tion Az = x — [F" (xo)]7! F (x). Sa dérivée forte est nulle au point 
zo. Cette application transforme la boule || x — x,|| < kt, en elle- 
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même. En effet, 
At—to=2—2%0—[F" (x) F (x) = 
= [EF (to) {EF (to) (x — to) — F (x) + F (xo)} — 
— [FT (mo) F (xo)- 

Par conséquent, 
4x — %0 KIT LZ" (&0) | EF" (to) (x — 20) — 

— EF (x)+F (20) + IE" (Go) F (0) |, 
c.-à-d. 

Az — 20 SM | Fo) (x — 20) — F (x) + F (x) [+ 4. (6) 
Considérons l'application auxiliaire © (x) = F (x) — F (xo) — 
— F' (xo) (x — to). Elle est différentiable et sa dérivée est égale 
à D (x) = FE" (x) — FF (xo). Si [| x — xoll  kto, on a l'évaluation 

ND" GIF" CF (eo) EL a 20] < Li. 
D'après le théorème de la moyenne (formule (9), $ 1) on en déduit que 
ID (=D (D (x) <Lék lle <LA. (7) 
Donc, si || x — xoll tk, de (6) et (7) on obtient 
1 4x — 20 << ML + k = k (M LEE + 1) = k (ht5 + 1) = kto. 
Cela signifie que l’application À transforme la boule || x — xol| 


< kt, en elle-même. Montrons maintenant que À est une contraction 
de cette boule. Pour || x — xol| & kto on a 


A" (x) = 1 —1F" (x)? FE (x) = LF (0) (F7 (0) — F'(x)), 
d’où 
NA’ (Go) I< MIE (0) — EF" (0 <ML | 2— 50 | < MLkto. 
Or, to est la plus petite des racines de l'équation ht? — £& + 1 == O, 
1—7V/1—4% 


C.-à-d. {9 = —5;—. C'est pourquoi 


, 1 VTT 1— V1 _A 
|| À Go) EMLRE to h VIRE LIVRE LL (8) 


d’où 
| 
At — Ar < Sri — 2 ff, 
ce qui signifie que À est une contraction. 


Par conséquent, dans la boule |] x — xo|| & kto il existe un point 
fixe x* et un seul le l’applicalion À. Pour ce point on a 


12 —[F'(xOT EE (x), c.-à-d. F(x*)=0. 


32—0167 
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D'autre part, 
An = Xn—|#" (to)]* F (Zn) = Lny1; 


donc, en vertu du principe des contractions, la suite {x,} converge 


vers x*. 
De l'inégalité (8) on déduit immédiatement l’évaluation suivante 


de la rapidité de convergence de la méthode modifiée de Newton: 


en — 2% SU co) F (x) (9) 


Ainsi, l’erreur de la méthode modifiée de Newton décroît comme 
une progression géométrique. Notons, pour comparer, que la méthode 
habituelle de Newton (qui consiste à définir les approximations 
successives par la formule (4) et non par la formule (5)) converge 
plus rapidement qu’une progression géométrique : pour cette méthode 


on à 


lan" | CAR. 


Exemple. Considérons l’équation intégrale non linéaire 
b 
x (s) = | K(s,t, x(t))dt, (40) 


où Æ (s, t, u) est une fonction continue et continüment différentiable 
Introduisons l’application y — F (x), définie par l'égalité 


b 
y (s) = z(s)— | K(s,t, æ(t))dt. 


Alors l’équation (10) peut s’écrire sous la forme F (x) = 0. 

Soit x, l’approximation initiale de la solution de cette équation. 
Alors la première correction Azx (s) = x, — x, est définie par l’équa- 
tion 

F'(xo) Az = — F(%5). (11) 


Si la fonction Æ (s,t, u) et l’espace dans lequel on considère 
l'équation (10) sont tels que la dérivée 7” (x) de l’application F peut 
être déterminée par « dérivation sous le signe d'intégration », c.-à-d. 


S1 
z= F' (%o) T 


signifie que 
b 


z(s)= x (s)— | K(s, t, tolt))x(t)dt, 


a 
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alors l’équation (11) s'écrit sous la forme 


b 
Ax (s)— | Ku(s, t, to(t)) Az (t) dt + Po (s), (12) 


b 
Do (S) — | K(s,t, to(t)) dt — xo(s). 


De manière analogue on peut trouver les corrections suivantes. 

Ainsi, la recherche de chaque approximation suivante se réduit 
à la résolution d’une équation intégrale linéaire. Lorsqu'on 
utilise la méthode modifiée de Newton, toutes les équations intégrales 
linéaires qu’on obtient de cette façon ont le même noyau. Pour un 
exposé plus détaillé de la méthode de Newton et des questions liées 
à cette méthode on peut consulter le livre [28], ainsi que l’article [27] 
de L. V. Kantorovitch qui est l’auteur des résultats fondamentaux 
concernant l'extension de la méthode de Newton aux équations 
opératorielles. 


COMPLÉMENT 


Algèbres de Banach 


par V. M. Tikhomirov 


Au chapitre III de cet ouvrage on s’est occupé de l'étude des 
espaces vectoriels. En particulier, on à mis en évidence l’importante 
classe d'espaces vectoriels, constituée par les espaces de Banach. 
Dans le présent complément on se propose d'étudier les algèbres 
de Banach, c.-à-d. les espaces de Banach, dans lesquels est 
définie la multiplication des éléments. La présence de la multipli- 
cation, jointe à la structure d'espace vectoriel et d'espace métrique, 
pourvoit les algèbres de Banach d’un grand nombre de propriétés 
remarquables. 


$ 1. Définitions. Exemples d’algèbres de Banach 


1. Algèbres de Banach. Isomorphisme des algèbres de Banach. 
Rappelons qu’on appelle espace vectoriel un ensemble non vide, 
muni de deux opérations, appelées addition et multiplicalion par 
un nombre, qui vérifient les huit axiomes formulés au $ 1, chap. III. 

Définition 1. Un espace vectoriel X s'appelle algèbre, 
s’il est muni d’une troisième opération, nommée mulliplication 
et satisfaisant aux axiomes suivants : 

4. (xy) z = x (y2). 

2. a (y +2) = y + xs; (y +2) x = yx + 2x. 

3. a (xy) = (ax) y — x (ay). 

4. S'il existe un élément e € X tel que ex — re — x, quel que 
soit x € X, on dit que e est l’unité de l'algèbre X el que X est une 
algèbre avec unité ?). 

5. Si la multiplication est commulative, c.-à-d. si elle satisfait 
à l’axiome 

Ty = UT, 
on dit que X est une algèbre commutative. 

Ce sont les algèbres commutatives avec unilé qui feront l'objet 
principal de notre étude. 

Toutes les algèbres considérées dans ce complément seront des 


algèbres sur le corps C des nombres complexes. 
Au $ 3 du chan. IIT on a introduil la notion d'espace normé, 


1) L'unité d’une algèbre est st toujours unique, car si un élément e’ jouissait 
de la propriété 4, on aurait ee’ = e = e”. 
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c.-à-d. d'espace vectoriel muni d’une norme || x|| satisfaisant aux 
trois axiomes formulés à la page 134. 

Définition 2. Un espace normé X s'appelle algèbre normée, 
s’il est une algèbre avec unité qui vérifie en plus les deux axiomes: 

6. |lell — 1. 

7. [ay KI xt vif. 

Si une algèbre normée X est, en outre, complète (c.-à-d. 
est un espace de Banach), on l’appelle algèbre de Banach. 

Une application F : X — Y s'appelle homomorphisme de l’algèbre 
X dans l'algèbre Ÿ, si elle vérifie les conditions: 


F + y) = Fr + Fy, (1) 
F (ax) = aFx, (2) 
F (xy) = Fx-Fy. (3) 


Deux algèbres X et Y sont dites isomorphes, s’il existe une appli- 
cation bijective F de X sur Ÿ vérifiant les conditions (1)-(3). 
Deux espaces normés X et Ÿ sont dits isométriques, s’il existe 
une application bijective F: X <+ Y vérifiant les conditions 
(1) et (2) et telle que 
Il Fxl = 1 2x. 


Définition 3 Deux algèbres de Banach X et Y sont dites 
isométriquement isomorphes, s’il existe un isomorphisme d’algèbre F : 
X <— YŸ qui est en même temps une isométrie de X et Ÿ, considérés 
comme espaces normés. 

2. Exemples d’algèbres de Banach. 

4. Le corps C Les nombres complexes {z} fournissent le 
plus simple exemple d’algèbre de Banach, si l’on introduit une 
norme par la formule 


Hal A= VE +R G=x+iy). 


Les nombres complexes forment un corps que l’on note C. Pour 
tous les éléments de C, excepté zéro, est définie la division, 
c.-à-d. l'opération inverse de la multiplication. Nous montrerons plus 
bas que C est la seule algèbre normée qui possède la structure de corps. 

2. L'algèbre Cr. Soit T un espace topologique de Haus- 
dorff compact. Désignons par Cr l’espace vectoriel constitué par 
l’ensemble des fonctions complexes continues x (t) définies sur T, 
muni des opérations habituelles donnant la somme de deux fonctions 
et le produit d’une fonction par un nombre, ainsi que de la norme 


Well max | (| 
1ET 
Aux chap. IT et III on a vu un cas particulier de l’espace Cr, 


où le rôle de 7 était joué par un segment [a, b] de la droite réelle. 
Un autre cas particulier important de l’espace Cr est fourni par 
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l'espace C° —{(z,, . .., z,)} des vecteurs complexes à n dimensions, 
c.-à-d. des fonctions sur un espace de n points. L’addition, la multi- 
plication par un nombre et la multiplication des éléments de C” se 
réalisent en coordonnées ; la norme sur C” est définie par la formule 
zÎ= max |z;]. 
1<i<n 

L'espace Cr est une algèbre de Banach commutative ayant pour 
unité la fonction e ({) = 1. La vérification du fait que tous les axio- 
mes sont satisfaits ne présente aucune difficulté. 

3. L’algèbre # des fonctions analytiques 
dans un disque. Désignons par # l’espace vectoriel des 
fonctions x (z) d’une variable complexe z, définies et continues sur le 
disque À ={z:| 2 | < 1} et analytiques à l’intérieur de ce disque. 
On définit la multiplication dans # comme la multiplication habi- 
tuelle des fonctions et on introduit une norme par la formule 

x ]= max] x (z)|. 
121<1 

Ceci fait de # une algèbre de Banach commutative avec unité. 
Tous les axiomes sont évidents. 

4. L'algèbre /,. Désignons par l; l’ensemble des suites 
complexes infinies dans les deux sens et absolument sommables 


= (0 .., Lin, + +, Lys Los Lis + + En, + - -), muni de la norme 
O0 
Hxl= > al (4) 
R=—— 00 


Appelons produit x-y de deux suites 


ZT = (40.., Lin, + + + Los + + +3 Tns + +.) 
et 


y = (0.., Ynns o + + Ygs © + +» Yns + + +) 


leur convolution z — æxx+y, c.-à-d. la suite dont les termes sont définis 
par la formule 


(mé 
Zn — (x * Y}n — D Tn-hÜ{Rhe (0) 
k——00 
Si à chaque suite x de !, on associe la série trigonométrique 


(= D ane, O<Lt<2n, 
R=— — 00 
alors la suite définie par la formule (5) correspond au produit x (#) x 
X y (t) des fonctions construites à partir des suites x et y. Aïnsi, 
l'algèbre Z, et l'algèbre W des fonctions x (£) à série de Fourier abso- 
lument convergente et munie de la norme (4) sont identiques (iso- 
métriquement isomorphes). En vertu de cetie dernière circonstance, 
les axiomes de l’algèbre et de l’espace normé pour /, deviennent 
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faciles à vérifier. Vérifions, par exemple, l’axiome 7. Pour z — x+y 
Izl= 2e 2 2 ang < 

n n kÀ 


LD TE Vanrlnl<Z(Eianal)ul=lellir if 


L’algèbre W est évidemment commutative; par conséquent, 
l'algèbre Z, est aussi commutative. L'unité de /, est la suite e qui 
correspond à la fonction e (f) = 1: tous les termes de cette suite 
sont nuls, excepté celui d'indice 0 qui est égal à 1. 

9. L’'algèbre des opérateurs bornés. Soit X 
un espace de Banach. Considérons l’espace Z(X, X) des opérateurs 
linéaires continus qui appliquent X dans lui-même, muni des opé- 
rations habituelles donnant la somme et le produit de deux opéra- 
teurs, ainsi que le produit d’un opérateur par un nombre (cf. n°5 1-3, 
$ 5, chap. IV). L'élément unité de Z(X, X) est l’opérateur identi- 
que. Faisons de Z(X, X) une algèbre de Banach, en définissant la 
norme, comme d'habitude, par la formule 


AÏ= sup |] Az |]. 
ll <1 


En effet, l’axiome 7 a été déjà vérifié (cf. formule (4), page 217). 
La démonstration de la complétude de Z(X, X) a été proposée au 
lecteur comme exercice à la page 217. L’algèbre Z(X, X) est l’un 
des plus importants exemples d’algèbre de Banach non commu- 
tative avec unité. 


3. Idéaux maximaux. 

Définition 4. On appelle idéal d’une algèbre commutative 
X un sous-espace 7 de X tel que pour tout y € TJ et pour tout x € X 
le produit yx appartient à Z/. L'idéal constitué du seul élément nul 
et l’idéal constitué par l’algèbre X tout entière sont appelés idéaux 
triviaux ; dans la suite ils ne seront pas étudiés. Un idéal est dit 
maximal, s’il n’est contenu dans aucun autre idéal non trivial. 

Etudions les notions introduites sur l'exemple de l’algèbre Cr. 

Soit une partie non vide du compact T. L'ensemble MZ — 
—{x (t) ECr:xz ()—=0,tE€.F} des fonctions, nulles sur F, forme, 
comme il est aisé de voir, un idéal de Cr. Les idéaux maximaux 
de Cr admetlent une description simple qui permet, en outre, de 
mieux comprendre l'essence de la théorie des algèbres de Banach 
commutalives. 

Lemme 1. Un idéal maximal de l'algèbre Cr est l'ensemble 
des fonctions de Cr nulles en un point fixe t0€ T. 


Démonstration. a) Soit M+ —{x (i) € Cr:x (to) = 0}. 
Alors M. est un idéal. Montrons qu'il est maximal. En effet, soit 
to () £ Mr, C.-à-d. zo (To) Æ 0. Pour tout y (5) € CT posons z (+) — 
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…L y(To) tot) 
= yt)— To(To) 


appartient à M. Aïinsi, pour tout élément n'appartenant pas 
à M.,, l'idéal engendré par M. et cet élément est trivial. Par consé- 
quent, Mr, est maximal. 

b) Inversement, soit A7 un idéal maximal de C7. 

Montrons qu'il existe un point, où toutes les fonctions apparte- 
nant à cet idéal sont nulles. En effet, s’il n’en est pas ainsi, pour 
tout point t € 7' il existe une fonction x, (t) € M telle que x, (rt) 
=Z 0. En vertu de la continuité de x, (ft) par rapport à t, il existe un 
voisinage U, du point 7 tel que x. (t) 0 dans U.. Du recouvrement 
ouvert T7 € |) U, extrayons un recouvrement fini Ur, ... Ur. 

T 


Alors z (to) — O0 et, par conséquent, 2 (t) 


Alors d’après la définition de l'idéal, xo (#4) = xx,(6) +, (6) +... 


... + 2x, () Tr (8) = > | tr, (t) appartient à M. 
! k=1 


Comme xo (t) > 0 partout sur T, la fonction — est continue. 
C’est pourquoi À — TT xzo ()E M. Or, l'idéal contenant 


l'unité d’une algèbre contient tous les éléments de cette algèbre, 
car y (t) — y (t):1. On en déduit que M est un idéal trivial, ce qui 
contredit l'hypothèse qu'il est maximal. Par conséquent, A1 est 
un idéal non trivial. 

Ainsi entre les idéaux maximaux et les points du support T on 
peut établir une correspondance biunivoque. Ceci permet de traiter 
les fonctions sur 7 comme des « fonctions sur l’espace des idéaux 
maximaux ». 

Nous allons montrer (et c’est le but de la théorie des algèbres de 
Banach commutatives qui sera exposée plus bas) qu'une telle algèbre 
X peut être réalisée par une sous-algèbre de l’algèbre des fonctions 
continues sur l’espace topologique de Hausdorîff compact, constitué 
par les idéaux maximaux de l'algèbre X. 


$ 2. Spectre et résolvante 


Dans ce paragraphe l’algèbre X n'est pas nécessairement commu- 
tative, mais possède un élément unité. Les considérations de ce 
paragraphe sont pour la plupart pareilles à celles du $ 5, chap. IV. 

1. Définitions et exemples. 

Définition. Un élément x € X est dit inversible, s'iladmet 


un inverse, C.-à-d. s’il existe un élément x-! tel que 
xx li — x lex —e. 


Dans le cas contraire on dit que l'élément x est non inversible. 
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On appelle spectre © (x) d'un élément x € X l’ensemble des 
nombres complexes À tels que l’élément Àe — x est non inversible. 
Sir éo (x), le point À est dit régulier. 

La fonction 


R,:CNo(x) — X, Rir=2(h=(ke- x) 1, 


définie sur l’ensemble des points réguliers d’un élément x s’appelie 
résolvante de cet élément. 

On appelle rayon spectral r (x) d'un élément x € X le nombre 

r(x)—= sup |À|. (1) 
AEO(X) 

Illustrons ces importantes notions sur des exemples. 

a) Si X — C, tous les éléments, sauf l’élémeut nul, sont 
inversibles. 

b) Si X — Cr, pour l’inversibilité de x (t) il faut et il suffit 
que la fonction x (f) soit partout différente de zéro. Le spectre © (x) 
coincide avec l'ensemble des valeurs de xt); la 
résolvanite R; est égale à 


et le rayon spectral 
r(æ)= ele maxfz(@ 


c) Si X = £Z(Y, Y) est l'algèbre des opérateurs bornés les 
éléments inversibles sont les opérateurs inversibles ; le spectre et la 
résolvante dans ce cas coïncident avec le spectre et la résolvante 
d’un opérateur, introduits au n° 7, $ 5, chap. IV. Au fond, dans ce 
paragraphe nous étudions sous forme générale les notions qu'on 
a déjà introduites pour l’algèbre de Banach des opérateursliuéaires 
bornés. 

2. Propriétés du spectre. 

Théorème 1. 1°. Quelle que soit la fonctionnelle f (x) de 
l’espace dual X*, la fonction f (x (À)) — F (D) est analytique sur C\X 0 (x) 
et F (À) — 0 quand | À | — co. 

2°. Le spectre © (x) d’un élément x de l'algèbre de Banach X est 
un ensemble non vide, compact dans C. On a l'inégalité 


r (x) <I] il. (2) 
Avant de démontrer le théorème 1 considérons quelques lemmes. 


Lemme 1. (cf. théorème 5, $ 5, chap. IV). Soit x un élément 
de l'algèbre de Banach X ayant la norme inférieure à 1. Alors l'élément 
e — x est inversible et 


(ée— x) l—e+rz+... La +... 
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En effet, posons s, =e+z<+...<+x". Alors 
[sn — sn fe" +. ant |< 


REA ébtatenus LE2 | Lontiee 


k 
K\ ni 
SANTE er 


i=1 


— 0. 


Donc, s, est une suite de Cauchy. Comme X est un espace complet, 
cette suite converge vers un élément s € X,. On a 
S(e—x)=limsn(e—x)=lim(e—- 2" =e, 
N— 00 n—>00 
On démontre de la même façon que (e — x) s = e. 
Corollaire. Quel qusoitr € X,ona 


(e — tx)! + e quand t —+ 0. 
En effet, 


(e—tzx) = lim(e+ir+...+(ix))—=e+oO(). 


Lemme 2. (cf. théorème 4, $ 5, chap. IV). Soit x, un élé- 
ment inversible et || Ax|| <{| x51|["# 
Alors x = xo + Âx est un élément inversible et 


2 =(e+x, Ax) 1x. 


En effet, t = zo + Ax = xo (e + xs Ax) = xo (e — x), || x|| — 
= || rt Ar| < 1. 

En appliquant le lemme 1, on obtient 

tj =(e—x) 1x, 
ce qu'il fallait démontrer. 

Corollaire 1. L'ensemble des éléments inversible d’une 
algèbre de Banach est ouvert (par rapport à la topologie normée de 
l'algèbre de Banach). L'ensemble des éléments non inversibles est fermé. 

Corollaire 2. La résolvante x (à) est une fonction continue 
de À sur C\o (x). 

En effet, x (Ào + AA) = (Aloe — x + Ae) 1 = (e + Akx (ko)) ?X 
X x (ko) 72 x (ho), en vertu du corollaire du lemme 1. 


AA — 0 
Lemmes3 (cf. n° 7, $ 5, chap. IV). Soit À, u € C\o (x). Alors 
a) Riz -R,x = Rix-Rix, 
b) Pix — Rx = (u — À) Rix-R,x (identité de Hilbert) 
Démonstration. a) Rar-R,x — (le — x) T (ue — x) "= 
= [ue — x) (e — x)]t = [he — x) (ue — x)] 1 = Rx Rix. 
b) En vertu de a) et de la définition de R: et R,,ona 


Riz = (ue — x) Rix-R x, 
Rx = (e — x) Rix-R x, 
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d'où Rax — Rx = (ue — ke) Rix Rx = (u — À) Rix-Rix, ce 
qu'il fallait démontrer. 

Corollaire. Si Ào € Co (x), alors x’ (Ào) — —x*? (ko). 

En vertu de b) et du corollaire 2 du lemme 2, on a: 

x" (lo) = lim 20) +00) _ — lim zxz(A):x (lo) = — 2° (ho). 

A0 T A A0 

Démontrons maintenant le théorème 1. 

1°. Soit f (x) une fonctionnelle linéaire continue de x, c.-à-d. 
f(x) E X*. Posons F (à) = f (x (à)) — f (Rix). En vertu du corrol- 
laire du lemme 3, pour Ào é © (x) on a: 


, _ pm FDF (ho) _ 7: t (A) — 2x (do) \ 
F Go) lim À — Ào = ina j ( À — ho }= 
… AU AU US T2 
1 (in (ER) — (eo) 
Ainsi, l’analyticité de F (À) est démontrée. 
D'autre part, pour [À | >{||xi}, en vertu du lemme 1, on a: 


LE (D I< I Mrs 1 & À) Île = Ile Re — 2) = 
Il fl # z\7! 
= 57 (5) 


FA | 

2°. a) Le spectre o(x) est non vide. Soit o (x) = 
— . Alors d’après 1°, quel que soit l'élément f € X*, F (à) est 
une fonction entière tendant vers zéro quand | À | — co. Cela signi- 
fie que F (À) = 0, c.-à-d. que f ((Âe — x) 71) — 0 pour tout f € X*. 
Mais alors, en vertu du corollaire du théorème de Hahn-Banach 
(n° 3, $ 1, chap. IV}, on doit avoir x! — 0, ce qui est impossible. 

b) Le spectre o(x) est compact. SilA|> ||xl|, 
alors d’après le lemme 1 l’élément Àe — x — À (e — +) est inver- 
sible, d’où l’on déduit que le spectre © (x) est borné, en même temps 
que l'inégalité (2). Du lemme 2 il résulte immédiatement que o (x) 
est fermé : si À, est un point régulier, le voisinage | AX | {|| x (ào)|| 
est constitué uniquement des points réguliers, car 


(Ào + A)e — x = Àçe — x + Ake. 


Citons deux corollaires du théorème 1. 

Corollaire 1. Si une algèbre de Banach sur le corps C est 
elle-même un corps, alors elle est isométriquement isomorphe à C. 

En effet, soit X un « corps de Banach » et soit x un élément 
arbitraire de X. Cherchons le nombre À pour lequel l’élément Àe — x 
est non inversible, donc nul. On a x — Àe. Il est clair que la corres- 
pondance x «+ À est un isomorphisme de X sur C. Comme || e[| — 1, 
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on à [x] — | À |. La correspondance considérée est donc une iso- 
métrie de À sur C. 

Corollaire 2. Le spectre de tout opérateur non nul ÀE€ 
E £(X, X) est non vide. 

Cette proposition a été déjà énoncée sans démonstration au $ 5, 
chap. IV (cf. page 228). 

3. Théorème du rayon spectral. 


Théorème 2. On a la formule suivante pour le rayon spectral : 
r(= lim] ae". (3) 


En effet, soit f un élément quelconque de X*. D’après le théorè- 
me 4, la fonction F (à) — f (x (à)) est analytique sur CKo (x). En 
particulier, F (À) est analytique dans le domaine | à | >|] x||. 

En vertu du lemme 1, dans ce domaine on a 


DEURCREES (e—+)"- > nr : 


FA)=} CODE Te. 


Cette décomposition, vraie pour || =, x|| en vertu du lemme , 
a lieu aussi pour |À |=> r (x) en vertu du théorème d’unicité pour les 
fonctions analytiques. Par conséquent, 


HD 


SP Anti 


Nous avons établi que l’ensemble des vecteurs Sn est faible- 
ment borné ; il est donc fortement borné. (Ce résultat, appelé parfois 
théorème de Banach-Steinhaus, a été démontré au $ 3, chap. IV; 
pour un exposé plus détaillé de cette question, cf. le traité ?211, 
chap. II.) Aïnsi, il existe un nombre c (À) dépendant de À tel que 


| <cQ) 


1 
d’où lim |2°|f" << |2X | pour tous les À tels que | À | > r (x); donc. 
R — 0 


lim||z"{[#<r (x). 
NN — 00 
D'autre part, si À E o (x), on a À" € © (x"), car l'élément À'e 


— à" est, évidemment, divisible par Àe — x. 
D'après le théorème 1, si u € © (x), on a lu | || x||. 
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En posant À — À", on en conclut que si ÀE wo (x), onal1|< 


La d'où rx) lim Y[zr| 


ñn — oo 


Le théorème est démontré. 


$ 3. Quelques résultats auxiliaires 


Dans ce paragraphe nous avons rassemblé une série de propositions 
auxiliaires dont la démonstration n'exige que des procédés techni- 
ques usuels. 

1. Théorème de l’algèbre quotient. Soient À une algèbre de 
Banach commutative à élément unité et Z un idéal de X. 

Notons tout d’abord que J est constitué uniquement des éléments 
non inversibles, car si z € Z est inversible, alors pour tout x € X 
on a (xz !)z—x€l, ce qui signifie que J est trivial. D'autre part, 
en vertu du lemme 1, $ 2, la distance de l'unité e à tout élément non 
inversible, et donc à tout idéal, est supérieure ou égale à 1. 

Considérons maintenant l’espace quotient X/I (cf. $ 1, chap. III) 
et introduisons-y l’opération de multiplication, en appelant produit 
de deux classes & et n de X/I la classe € qui contient l’élément x :y, 
où x et y sont des représentants des classes & et n. (Vérifier que le 
résultat ne change pas, si l’on remplace x et y par n'importe quels 
deux autres représentants des mêmes classes & et n et que l’opération 
de « multiplication » ainsi introduite satisfait aux axiomes 1-5 
du $ {.) Ainsi, l’espace X/T devient une algèbre commutative. On 
l'appelle algèbre quotient de X par l'idéal J. 

Introduisons dans X/1 une norme, en posant 


IE = inf| zx + ||, 
vel 


où x est un représentant de Ë. 
On a le théorème suivant. 


Théorème 1. Si X est une algèbre de Banach et Test un idéal 
fermé de X, alors l'algèbre quotient X/I est aussi une algèbre de Banach. 


Il s’agit de démontrer que : 1) la fonctionnelle || || satisfait aux 
axiomes de la norme, 2) X/I est un espace complet pour cette norme. 
1) a) || EI] — inf [x + y|| Z 0, car la norme est non négative. 


D'autre part, "1 0|| — if O + yll — 0. Soit | &9 | — 0. Alors 
inf | to + y|l = 0, ro € Eo. Éela signifie qu'il existe une suite y, € 1 


telle que || Zo + y,ll — O0, ou, ce qui revient au même, UN Fo 
Comme Z est fermé, l'élément x doit appartenir à Z, c.-à-d. £, 

Ainsi, || [| Z 0, où l'égalité || 61] — 0 a lieu si et eu bonont 
Si ë = 0. 
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b) ILAEI = inf Ile + gl = IA inf [a+ LA IIEN 
yeEl yEI 


pour À Æ 0; pour À = 0 l'égalité est évidente. 
c) NEtnli= inflla+y+zh= inf Iatu+ytol< 
< ini le+u+ inf fly +vi= JE lnlt 
d) Ven] int au +2 1< nf AIG) +o< 
< inffle+ull inffy+vl=félinlt 


e) E—e+lT, c.-à-d. E?— e? + I] —e + I. Par conséquent, 
E? — E, d'où l’on déduit que || £[| —|| £?|] || E|F. Or, l'élément 
E n'est pas équivalent à zéro, car le voisinage du point e, comme 
nous avons remarqué plus haut, ne contient pas d'éléments non in- 
versibles qui constituent l'idéal 7. Donc, 1 || E||. Mais, d'autre 
part, | EI] — ini le + yll, c.-à-d. [| EI 1. Par conséquent, 

y € 


IE = 1. 
2) Démontrons maintenant que X/I est complet. Soit 61, ... 
. En. - - . une suite de Cauchy, c'est-à-dire [| Énim — Enll < € 


pour n>œN(Ee), m>1. Choisissons e&k = 7% et les numéros n} 


1 
de façon que Ï Eny+m — En, Îl <- 


{ e e. Le 
On a || &n, — En, Îl < 3: Choisissons deux représentants x1 € 


€ £a, et z2 € Ën, de façon que || x: — xl] K 1. 
De manière analogue construisons æs, . . . Xp, . . ., æp € En de 


{ . . 
façon que || 2x — pl] DE : La suite x, est une suite de Cauchy 


dans X. Or, par hypothèse, X est complet. Donc, il existe une limite 
zo = lim x. Considérons la classe &o— xo + Z. On a 


R-> 00 


IE, El infflar— 2o+vl<llan- ol > 0 


Par conséquent, &,, —> £o, c.-à-d. X/I est un espace complet. Le 
théorème est démontré. 

2. Trois lemmes. Pour la suite nous aurons besoin des trois 
lemmes suivants se rapportant respectivement à la théorie des en- 
sembles, à l’algèbre et à la topologie. 


Lemme 1. Tout idéal non trivial I est contenu dans un idéal 
maximal. 


La démonstration de ce lemme est fondée sur le lemme de Zorn, 
énoncé à la page 34. 
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En effet, soit l’ensemble de tous les idéaux contenant 7. L'’en- 
semble Ÿ est partiellement ordonné par la relation d’inclusion: 
1, D, si 1, S I: Pour tout ensemble totalement ordonné {7,} 
de J la réunion |} Z, est un idéal non trivial servant de borne supé- 


(02 

rieure pour {/,}. Par conséquent, en vertu du lemme de Zorn, 1 est 
suivi d’un élément maximal, c.-à-d. appartient 4 un idéal maximal. 

Corollaire. Si l'algèbre X n'est pas un corps, elle contient 
un idéal maximal. De plus, tout élément non inversible, autre que 
l'élément nul, appartient à un idéal maximal. 

En effet, prenons un élément non inversible quelconque x, 5 O0 
et considérons l’ensemble xz,:X. C’est certainement un idéal. Il 
contient l'élément x, et ne contient pas l’unité e de X, c.-à-d. il 
n’est pas un idéal trivial. En vertu du lemme 1, cet idéal est contenu 
dans un idéal maximal. 


Lemme 2. Pour qu'un idéal I soit contenu dans un idéal non 
trivial I! € X, il faut et il suffit que l'algèbre X/I possède un idéal 
non trivial. 


Démontrons que la condition est nécessaire. Soit [€ l'E X, 
IÆI, XI". Dans la classe & — x + TI considérons la sous- 
classe des Ë”, pour lesquels x” € I”. Il est aisé de voir qu’on obtient 
alors un idéal non trivial de X/1. On démontre de manière analogue 
que la condition est suffisante. 


Lemme 3. La fermeture d'un idéal I est un idéal (non trivial). 


La non-trivialité découle du fait que Z est formé uniquement 
d'éléments singuliers ; le reste découle de la continuité des opérations 
algébriques. 

Corollaire. Tout idéal maximal est fermé. 


$ 4. Théorèmes fondamentaux 


Dans ce paragraphe X est une algèbre de Banach commutative 
avec unité. 

1. Fonctionnelles linéaires continues multiplicatives et idéaux 
maximaux. 

Définition 1. Une fonctionnelle linéaire continue f sur 
l'algèbre de Banach X est dite multiplicative, si quels que soient x 


et y, on a 
J (y) = Î ()-f GW). (1) 


Nous désignerons l’ensemble de toutes les fonctionnelles linéaires 
continues multiplicatives non triviales par . 

Remarquons qu’une fonctionnelle linéaire continue multiplica- 
tive pourrait être définie comme un homomorphisme 
continu de À dans C. 
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SifEA4{,ona 
| f (x) | KI xl, (2) 


car si pour un certain xo, tel que [| xoll = 1, on a 
[f(t)|=À > 1, alors|f(x?)[ = À" + oo, 
c.-à-d. f n'est pas continue, ce qui contredit l'hypothèse. 
D'autre part, 
f (e) = f (e7) = ( (e))”, 

d’où l’on déduit ou bien que f (e) — 0, c.-à-d. que f est triviale, 
ou bien que 

j (e) = 1. (3) 


De (2) et (3) il résulte que les fonctionnelles linéaires continues 
multiplicatives non triviales ont la norme égale à 1, de sorte que o# 
est un sous-ensemble de la sphère unité de l’espace dual X*. 

Le sous-espace de nullité de la fonctionnelle f (c.-à-d. l’ensemble 
des x € X tels que f (x) — 0) s'appelle noyau de f et se note Ker f. 


Lemme 1. SifEch, le noyau Ker f est un idéal maximal. 
En effet, si y € I = KerfetxEe€ X,ona 


f (y:x) = f (y)-f (x) — 0, c.-à-d. y-x € Ker f. 


Donc, Ker f est un idéal. Montrons que Ker f est un idéal maxi- 
mal. Supposons qu’il n’en soit pas ainsi. Alors Ker f peut être élargi 
de façon à obtenir un idéal 7 -£ X contenant un élément x, à Ker f. 
Or, Ker jf est de codimension 1 (cf. chap. III, $ 1, n° 6). Donc, l’élé- 
ment e peut être mis sous la forme 


e = to +y 


avec y à Ker f. On en déduit que e € Z. Par conséquent, 7 — X. La 
contradiction ainsi obtenue prouve le lemme. 


Lemme 2. Quel que soit l'idéal maximal M, on peut construire 
une fonctionnelle linéaire continue multiplicative et une seule f € «A 
telle que M = Ker f. 

En effet, d’après le corollaire du lemme 3, $ 3, M est un idéal 
fermé. En appliquant le théorème 1 du $ 3, on obtient que X/M 
est une algèbre de Banach. Mais alors, d’après le lemme 2, $ 3, X/M 
n’a pas d’idéaux non triviaux, c.-à-d. l’algèbre X/M ne contient pas 
d'éléments singuliers non nuls (cf. corollaire du lemme 1, $ 3). Par 
conséquent, X/M est à la fois corps et algèbre de Banach. 

D'après le corolllaire 4 du théorème 1, $ 2, le corps X/M est iso- 
morphe à C. Cela signifie, par définition, que pour tout x € X il 
existe un nombre f (x) € C, el un seul, tel que 


x —=f(x)je+u, u€EM. (4) 
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Montrons que f est un homomorphisme. Démontrons, par exem- 
ple, que f (x-y) —=f(x)-f (y). On a 
xz=f{x)-e+u, u€EM, 


y=f{yee+v, veEM, 
d’où 
zy = f(x) fG)e+w, wEM. 


Cela signifie précisément que f (x-y) — f (x) -f (y). On démontre 
de manière analogue les relations 


f(x + y) = jf () +7) et f Qx) = À f (x). 


En outre, si x € M, de (4) il résulte que f (x) — 0; de même, si 
x = e, on a f (x) — 1. Le lemme est démontré. 

On voit donc qu'il existe une correspondance biunivoque entre 
les idéaux maximaux M et les fonctionnelles f de #. Conformément 
à cette circonstance, convenons de désigner par f», les fonctionnelles 
de # et par M les idéaux maximaux correspondants. Nous allons 
désigner par la même lettre c# l’ensemble des idéaux maximaux {M} 
et l’ensemble des fonctionnelles qui leur correspondent {f,}. 

Soit x un élément de X. Considérons la fonction x (M) sur #, 
définie par la formule 


(La fonction x (M), construite à partir de l'élément x, fait corres- 
pondre à chaque idéal maximal M le nombre f,, (x), c.-à-d. l’image 
de l'élément x par l’homomorphisme correspondant à l'idéal 4.) 
Nous avons obtenu ainsi une réalisation des éléments de l’algèbre X 
par des fonctions définies sur l’ensemble # ; c’est la réalisation dont 
il était question à la fin du $ 1. 

2. Topologie sur l’ensemble ,#£. Théorèmes fondamentaux. Il reste 
à démontrer que l’ensemble # est compact pour une certaine topo- 
logie et que les fonctions x (M) sont continues pour la même topo- 
logie. 

Un peu plus haut nous avons remarqué que <# est un sous-en- 
semble de la boule unité. D'autre part, au n° 4, $ 3, chap. IV, on 
a démontré pour le cas d’un espace séparable la proposition suivante. 

Dans le dual X* d'un espace de Banach la boule unité est compacte 
pour la topologie *-faible. 

Une démonstration de ce théorème pour le cas général est donnée, 
par exemple, dans [211]. 

Rappelons que la topologie *-faible est définie par la famille 
des voisinages 


Ux, . Emi 6 (/o) = 
{EX | (ah) <G A=lum} 


là 33—0167 


514 COMPLÉMENT. ALGÈBRES DE BANACH 


Nous allons considérer l’ensemble «# par rapport à la topologie 
*_faible. La compacité de c# découle du résultat formulé ci-desus et 
du lemme suivant. 


Lemme 3. L'ensemble À est une partie fermée de la boule unité 
dans X* et les fonctions x (M) sont continues sur #. 

En effet, soit f, une fonctionnelle appartenant à la fermeture 
de eZ. Cela signifie que dans tout voisinage de base de l’application 
fo il existe un homomorphisme f,, engendré par un idéal maximal 4. 
Considérons le voisinage U,,y, x+y, 6 Uo). En vertu de (6) et de la 
définition de x (M)ona 


| fu (x) — fo (x) | € 6, 
| far (Y) — fo (y) | 6, (7) 
far + y) — fo (x + y) | < 8. 


Or, fm est un homomorphisme, c.-à-d. fu (x + y) = fm (x) + 
+ fm (y). Par conséquent, de (7) il résulte que 


fo (x + y) = fo (&) + fo (y). 


De manière analogue on peut montrer que fo (ax) = afo (x) 
et fo (ty) = fo (x) -fo (y) (1 faut prendre les voisinages U,, 0x, 8 (0) 
et U,, Yr Xyr Ô 07° 

Cela signifie que f est une fonctionnelle linéaire continue multi- 
plicative. Par ailleurs, en prenant le voisinage U, 5 (fo), on obtient 
que fo (e) = 1, c.-à-d. que fo est non triviale. Donc, fo Ec#, c.-à-d. 
est fermé. 

Montrons maintenant que la fonction xo (M) = fo (x) est continue 
sur oc. 

Soit MoEcA. Pour € = 0 donné considérons le voisinage 
Use (Mo). Si M € Uxsre (M5), alors d’après (6) on a 


| fu (Xo) — fMo (to)| =] to (M) -- 2x0 (M)|< €. 


Or, cela signifie que la fonction xo (M) est continue au point M. 

Le lemme est démontré. 

Théorème 1. L'application x — x (M) définit un homomor- 
phisme de l'algèbre X dans l'algèbre C,y des fonctions continues sur 
l'espace de Hausdorff compact 4, constitué par les idéaux maximaux 
de l'algèbre X ; en outre, 


x (M) = max | x (M) | KI] xil. (8) 

D'après ce qui précède, il ne reste à démontrer que la relation (8). 
Remarquons que d’après la définition de f (x), quel que soit M, 
l'élément z — fm (x) e appartient à l’idéal A, c.-à-d. est non inver- 


sible. Cela signifie que fm (x) € o (x). D'autre part, en prenant un 
nombre arbitraire Ào € © (x), on voit que x — 4e est non inversible 
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et appartient donc à un idéal maximal M. Mais alors 0 — fy (x—Àv) 
c.-à-d. Ào — fy (x). Ainsi, l’image de «# par l'application x (M) 
coïncide avec © (x). Par conséquent, en vertu de la partie 2° du 
théorème 1, $ 2, on conclut que l'inégalité (8) est vraie. 
Il nous reste à préciser le théorème 1 pour diverses hypothèses 
concernant l'algèbre X. Introduisons les trois notions suivantes. 
Définition 2. L'intersection À — ff M de tous les 


Mec! 
idéaux maximaux s'appelle radical de X. Si R —{0}, on dit (par 
abus de langage) que X n’a pas de radical. L’algèbre de Banach X est 
dite régulière, si |] x°|| —|| x|l?. Elle est dite symétrique, si pour toute 
fonction x (M) il existe un élément y € X tel que y (M) = x (M). 
(Le trait ici désigne le complexe conjugué.) 


Théorème Z. a) Si le radical de l'algèbre X ne contient que 
l'élément nul, l'application x — x (M\ est injective. 

b) Si l'algèbre X est régulière, alors elle est isométriquement iso- 
morphe à son image dans Cm; en particulier, X n'a pas de radical. 

c) Si l'algèbre X est symétrique, alors son image par l'application 
z— x (M) est partout dense dans C',,y. 

d) Si l'algèbre X jouit des propriétés b) et c), elle est isométrique- 
ment isomorphe à C y: 


Démonstration. Démontrons d’abord la dernière affir- 
mation, en supposant que les autres soient vraies. D'après b), la 
correspondance biunivoque x<>zx (M) est une isométrie: [| x{lx — 
— max | x (M) |. D'après c), l’ensemble {x (M)} est partout dense 


M € 
dans C,y. Or, À est un espace complet. Donc (puisque les normes 
dans X et dans C,y sont fgales), {af M)} est aussi complet, c.-à-d. 
{x (M)} = Coye 

Démontrons a). Soit xo= 0 et xo (M) = 0 sur ef. Cela signifie 
que fm (xo) = 0 pour tous les M, c.-à-d. xo € Ker f,, pour tous les M 
et donc, xo ER. Or, R —={0}, d'où xs — 0. La contradiction obtenue 


prouve a). 

Pour démontrer b), remarquons que l'égalité || x?|| —{|| x|[? 
. . . r qe . 2 ne 
implique immédiatement que lim V4 x?" =1l zil: 


n —> oo 
En appliquant le théorème du rayon spectral (théorème 2, $ 2), 
on obtient 


r (x) =|] x||. (9) 


De (9) il résulte tout d’abord que le radical est constitué du seul 
élément nul, car en admettant que 0x ER, on doit avoir 
fm (to) = O pour tous les M, c.-à-d. o (x) —{0}, ce qui contredit 
l'hypothèse que r (x0o) — || &oll 0. 

33* 
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D'autre part, de (9) il résulte que l'application x <— x (M) qui 
représente un isomorphisme de X sur la sous-algèbre correspondante 
{x (M)} de C,n est isométrique, car d’après (8) on a 


z(M — max|z(M)|=r(x)=| xl. 
le) leg = mexle (Ar (a) Il 


La démonstration de c) fait appel à l’un des plus remarquables 
théorèmes de l’algèbre et de l’analyse, appelé théorème de Stone- 
Weierstrass, dont voici l’énoncé : 

Soit Cr l'algèbre de Banach des fonctions continues sur un compact 
T, et soit À une sous-algèbre de Cr telle que : 

1) L'unité de Cr (c.-à-d. la fonction e (t) = 1) appartient à À. 

2) L'’algèbre À sépare les points de T (c.-à-d. quels que soient t4 Æ to, 
il existe une fonction x (t) € À telle que x (t:) Æ x (t)). 

3) L'algèbre A est stable par rapport à l'application x (t) — x (t) 
(c.-à-d. x (t) € À implique x (t) € À). 

Alors À est partout dense dans Cr. 

Pour la démonstration du théorème de Stone-Weierstrass voir 
[13], [21], [26]. 

Démontrons maintenant c). Soit À —{x (M)} l’image de X par 
l'application zx —+ x (M). 

De (4) il résulte immédiatement que e + e (M) = 1, c.-à-d. 
que e (M) — 1 € À. Soient M, et M; deux idéaux maximaux dis- 
tincts. Cela signifie qu’il existe un élément zx, appartenant à NW; 
et n’appartenant pas à M, (ou inversement). Alors 


to(Mi)= fm (to) = 0, x(M2)= fm (x) 0, 


ce qui signifie que À sépare les points de «#. Par ailleurs, d’après 
la définition même, l'algèbre À est stable pour l'application 


xz(t) = x (t). En appliquant le théorème de Stone-Weierstrass, on 
obtient c). 

Le théorème est démontré. 

3. Théorème de Wiener ; exercices. La théorie des algèbres 
de Banach admet des applications très diverses. 

Rappelons quelques résultats portant sur l’algèbre et sur l’analy- 
se que nous avons déjà obtenus chemin faisant. 

Si une algèbre de Banach sur le corps C est elle-même un corps, alors 
elle est isométriquement isomorphe à C. 

Le spectre de tout opérateur borné non nul dans un espace de Banach 
est non vide. 

Pour tout opérateur borné À dans un espace de Banach X la limite 


lim V4 | 4° || = r (4), existe et le spectre de À est contenu tout 
1 — 00 


entier dans le disque r (4). 
Démontrons maintenant, en utilisant la théorie des algèbres de 
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Banach commutatives, le théorème suivant, dû à Wiener: 
Si une fonction x (8) est représentable par une série de Fourier abso- 
lument convergente 


x (8) = . D, æneikô 


== — 00 


et ne s'annule nulle part, alors la fonction y (8) = 7 est aussi 


représentable par une série de Fourier absolument convergente. 

Considérons l'algèbre Z, des séries absolument convergentes (cf. 
exercice 4, n° 2, $ 1). Cherchons l’espace «# pour /,. Il est aisé de 
voir que pour définir un homomorphisme de /, dans C, il suffit de le 
définir pour la fonction x, (f) — eït, car alors il s'étend univoque- 
ment à l,. Posons fy (to) = fm (eÿ) — €. Alorsf,, (xs) = fu (e) = 
— (1, D'après (2) on a 


[El = fm (to) | KI Toll = 1, 
{ _ _ 
Er <a 4, 


d'où |£ | — 14, c.-à-d. & — ei, Donc, l’ensemble <# se trouve en 
correspondance biunivoque avec la circonférence | & | -— 1. Le fait 


que la fonction x (8) — > xyeïk0 ne s’annule nulle part dans l’inter- 
R 


valle —n < 0 < n signifie que la suite x = (..., &_n, . . ., To, . . 
-.., Zn, - - .) n'appartient à aucun idéal maximal. Donc, d’après 
le corollaire du lemme 1, $ 3, cette suite est inversible dans l’algè- 
bre l,. Posons y—x l—{..., y_n, .: . ., Yo, + + +, Un, + . .). Alors 


y (M) = fm (y) = D yReR0 = fr a == —— ——, 


kR=— — 00 D zpetr0 
R=— — oo 
ce qu'il fallait démontrer. 

Deux autres applications importantes de la théorie des algèbres 
de Banach, à savoir le théorème spectral pour les opérateurs bornés 
et le théorème de Stone-Cech, seront formulées plus bas sous forme 
d'exercices (cf. exercices 8 et 9). 

Exercices. 1. a) Montrer que l’espace des idéaux maximaux 
de l’algèbre Æ (cf. exemple 3, n° 2, $ 1) peut être mis en correspon- 
dance biunivoque et continue avec les points du disque unité | z | < 
< 1. 

b) Montrer que l’algèbre # est régulière (et, donc, n’a pas de 
radical), mais n’est pas symétrique. 

2. Qu'est-ce qui nous empêche d'affirmer que l'algèbre Z, (cf. 
exemple 4, n° 2, $ 1)est isométriquement isomorphe à l’espace C4, 
c.-à-d. à l’espace des fonctions continues sur la circonférence | & |—1. 
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3. Démontrer qu'on a le théorème : 
Soit x (2) = } Ta, > | Tr |L'oet x(2) ÆOpour |z|< 1. 
k=—0 R=0 


Alors la fonction y (2) — 0) est développable en série de Taylor, 


absolument convergente pour | z | < 1. 
4. Désignons par C” [a, b] l’ensemble des fonctions x (t), n fois 
continûment dérivables sur le segment [a, bl. 
(a) Montrer que C” La, b] est une algèbre de Banach par rapport 
aux opérations habituelles et à la norme définie par la formule 
ñn 


4 
lzl= D À max | 20 (91. 


k—0 a<t<b 


b) Trouver les idéaux maximaux de C? [a, b] (cf. [13], pp. 19, 

20). 

c) Vérifier que C” [a, b] est une algèbre symétrique sans radical. 

Quel résultat obtient-on dans ce cas, en appliquant le théorème 2? 
5. Soit CBV [0, 1] l'algèbre des fonctions complexes continues 

à variation bornée sur le segment [0, 1] avec la norme 


x 11 = 2,17 G)1+ Var (x, [0, 1]). 


a) Montrer que CBV [0, 1] est une algèbre de Banach. 

b) Trouver les idéaux maximaux de cette algèbre. 

6. Donner un exemple d’algèbre de Banach coïncidant avec son 
radical. 

7. Décrire tous les idéaux fermés de l'algèbre C [a, b1. 

8. Soit Z' un espace topologique complètement régulier (cf. n° 6, 
$ », chap. IT). Désignons par Br l’ensemble de toutes les fonctions 
complexes bornées, définies sur T, muni des opérations habituelles 
et de la norme || z|| — sup | æ (é) |. 

tE 


a) Vérifier que Br est une algèbre régulière et symétrique sans 
radical. 

b) Montrer qu'il existe un homéomorphisme (injectif) de 7 dans 
l’espace # des idéaux maximaux de l’algèbre Br et que l’image de T 
par cet homéomorphisme est partout dense dans #. 

c) Montrer que toute fonction complexe bornée sur l’image de T 
par cet homéomorphisme admet un prolongement continu unique 
sur cf. 

En ajoutant à b) l'affirmation que 4 est un compact (cette affir- 
mation résulte immédiatement de a), si l’on applique les théorèmes 1 
et 2 du $ 4), on obtient le théorème connu de Tikhonov sur l'extension 
compacte. L'’assertion c) est due à Stone et à Cech. Une extension 
compacte qui jouit de la propriété c) est dite maximale. L'assertion 
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c) signifie donc que c# est une extension compacte maximale (cf. [221). 
9. Soit Æ un espace de Hilbert. Considérons l'algèbre Z (H, H) 
et sa sous-algèbre commutative B (45), engendrée par un opérateur 
auto-adjoint Ao (c.-à-d. la fermeture de l’enveloppe linéaire des 
puissances de À 0). 
a) Montrer que l’algèbre B (4,) est régulière et n’a pas de radical 
b) Montrer que B (A5) est symétrique et que, de plus, 


red 


x (M) = a* (M), 


où x* est l’adjoint de l’opérateur x € B (45) et x (M) est l’applica- 
tion construite au $ 4. À propos de l’assertion b) voir aussi l’exerci- 
ce 10 c). 

En D liquent à l’algèbre B (4) le théorème 2, $ 4, on obtient 
le théorème spectral pour les opérateurs auto-adjoints (cf. [22], 
chap. X ; [26], chap. Il). 

10. Une algèbre de Banach (non nécessairement commutative) 
est dite algèbre à involution, s’il existe une application X — X 
jouissant des propriétés suivantes : 


+ y)" = 2* + y*, (ay)* = y*x*, 
(ax)* = aa*, (x*)* = x. 


Une algèbre à involution s'appelle B*-algèbre, si elle jouit, en plus, 
de la propriété || xz*|| —|| x||. 

a) Montrer que l’algèbre Z (H, H) est une B*-algèbre (cf. [22]). 

b) Montrer qu’une B*-algèbre commutative est régulière 
(cf. [221]. 

c) Montrer que toute B*-algèbre est symétrique et que, de plus, 
x(M) = x* (M) (cf. [22], lemme d’Arens). 

Les assertions b) et c), adjointes au théorème 2, donnent le résul- 
tat suivant, dû à Guelfand et à Naïmark et appelé parfois théorème 
fondamental de la théorie des algèbres de Banach commutatives : 

Une B*-algèbre commutative est isométriquement isomorphe à 


l'algèbre Cm l'isomorphisme possédant la propriété x (M) = x* (M). 

Ainsi, l'objet algébrique abstrait, décrit au moyen de 24 axiomes 
(dont 13 axiomes de l’algèbre commutative, 5 axiomes concernant 
la norme, l’axiome de complétude et 5 axiomes de la B*-algèbre), 
peut être réalisé par l’algèbre des fonctions continues sur un espace 
topologique de Hausdorif compact. 

Ceci permet de voir d’un point de vue commun des résultats 
de nature apparemment différente, tels que le théorème de Wie- 
ner sur les séries trigonométriques absolument convergentes, le 
théorème du développement spectral d’un opérateur auto-adjoint, 


Jes théorèmes topologiques de Tikhonov, Stone et Cech et bien d’autres 
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